Przejdź do głównej zawartości

CAPTCHA, czyli kapcza


Od czasu do czasu na zajęciach Akademii Seniora podczas korzystania z różnych serwisów pojawia się konieczność rozwiązania małej zgadywanki. Wyświetlają się jakieś pokręcone wyrazy, albo zdjęcia z numerami domów lub nazwami ulic. I trzeba te znaki przeczytać i wpisać z klawiatury ich treść..Napotykając coś takiego, seniorzy przecierają oczy i wołają ze zdumieniem: co to jest?!

A ja odpowiadam: to jest właśnie “kapcza”.

I wtedy wszyscy jeszcze większymi oczami patrzą na mnie. Co???!!!

Takie sytuacje powtarzają się regularnie, co skłoniło mnie do napisania poniższego wyjaśnienia.

Zacznę od definicji z Wikipedii.

CAPTCHA – rodzaj techniki stosowanej jako zabezpieczenie na stronach www, Jej celem jest dopuszczenie do przesłania danych tylko wypełnionych przez człowieka.
Technika ta chroni m.in.:
  • formularze – przed spamem
  • portal – przed zakładaniem kont przez automaty
  • fora dyskusyjne
  • usługi typu Kto jest kim – przed automatycznymi zapytaniami
  • blogi – przed reklamami w komentarzach

Na podstawie definicji temat captcha może się wydawać mało interesujący i płytki. Tymczasem jeśli się przyjrzymy sytuacji głębiej, to dostrzeżemy wojnę, która napędza rozwój potężnych gałęzi technologii. 

Co to więc jest - pisze się captcha a mówi się kapcza. To dziwne słowo jest akronimem angielskiego zdania: Completely Automated Public Turing test to tell Computers and Humans Apart. Po polsku oznacza to całkowicie automatyczny test Turinga do odróżnienia człowieka od programu komputerowego. Jest to bardzo szeroko stosowane zabezpieczenie. Większość serwisów stosuje ten system, aby uchronić bezpieczeństwo swoje i swoich klientów. CAPTCHA jest też sposobem na ochronę haseł przed automatycznym rozszyfrowaniem.

Z jednej bowiem strony captcha to po prostu celowe zniekształcenie liter tekstu, w taki sposób, aby nie odczytał tego komputer. Dla kogoś, kto potrafił rozczytać ręcznie pisane przez lekarza recepty, takie zabezpieczenie nie było przeszkodą. Łatwe do pokonania jak bułka z masłem. Wydawało się, że jeśli ktoś rozwiąże test captcha to musi to być człowiek.

Do niedawana tak było. Komputery potrafiły odczytać litery z pliku tekstowego, ale nie ze zdjęcia. Pojawiły się jednak programy typu OCR. Potrafiły one odczytywać napisy ze zdjęcia i przekształcać je do pliku tekstowego umożliwiając edycję. Chociaż oryginał nie był możliwy do modyfikacji to komputery tworzyły kopię w postaci pliku. A taki plik może być zapisany w dowolnym edytowalnym formacie tekstowym. W niektórych przypadkach okazywało się to bardzo przydatne. Ale też niosło potencjalne zagrożenia dla bezpieczeństwa w sieci.

Twórcy captcha coraz bardziej deformowali tekst, aby coraz trudniej komputer mógł rozpoznać. Stosowano więc triki polegające na fotografowaniu na przykład tabliczek z nazwami ulic lub tym podobne. Człowiek siedzący przed komputerem jest w stanie odczytać sens tekstu. Dla komputera to zdjęcie bezładna plama pikseli, lub mówiąc ściślej matryca liczb bez głębszego znaczenia. Pojawiły się wkrótce programy odczytujące treść obrazu. I znów captcha stała się łatwiejsza do pokonania przez komputer.

Są już programy, które rozpoznają obiekty na zdjęciu. Na przykład w wyszukiwarce Google jest możliwość wyszukiwania obrazem. Zamiast wpisywać słowo kluczowe, jako podstawę do wyszukiwania wklejamy obraz. Serwery Google’a analizują obraz, odnajdują jego znaczenie i traktują jak słowo kluczowe. 

Rozpoznawanie obrazu jest bardzo ważną i szybko rozwijającą się dziedziną. Jako przykład można tu podać rozpoznawanie twarzy. Systemy kamer na lotniskach rejestrują, a komputery analizują i porównują do przechowywanych wzorców. Służy to odnajdywaniu osób poszukiwanych np. przestępców. Ale też może posłużyć drugiej stronie. Takie programy w rękach przestępców stanowią oręże do pokonywania zabezpieczeń typu captcha przez programy zwane botam. Służą one do tworzenia spamu, szpiegowania, podglądania.

Captcha stosuje więc coraz bardziej wyrafinowane sposoby zniekształcania liter, aby tekst był trudny do odczytania przez komputer. Jest to bardzo popularny sposób na utrzymanie poziomu bezpieczeństwa w internecie. Szacuje się, że codziennie captcha jest używana 200 milionów razy. Specjaliści z Google, którzy lubią wielkie liczby wpadli na świetny pomysł, aby to upiec dwie pieczenie przy jednym ogniu. Firma Google ambitnie obrała sobie za cel, aby wszystkie książki na świecie przekształcić do formy cyfrowej.. Nie chodzi oczywiście o wszystkie egzemplarze, ale tytuły. Odbywa się to w ten sposób, że książka papierowa jest skanowana i konwertowana na plik tekstowy. Praktycznie zamiana książek z postaci papierowej na cyfrową, to jest to samo działanie, co captcha. 

Pomysł inżynierów Google polega na tym, że wśród niektórych skanowanych książek, zwłaszcza starych, są fragmenty tekstu nieczytelne dla programów OCR. Może to wynikać z kształtu czcionki, zniszczenia papieru, lub jeszcze innych czynników. Opracowali więc program, który z tych fragmentów tworzy hasła do zgadnięcia przez ludzi podczas rejestrowania się i logowania do różnych serwisów. Nazwali to re-Captcha. Dlatego re, bo informacja jest jeszcze raz używana. Można pokusić się o stwierdzenie “recyklingowana”. Działa to w ten sposób, że jeśli w danym momencie captchę odgaduje wielka liczba niepowiązanych ze sobą użytkowników, to najbardziej prawdopodobne jest to, że prawidłowe hasło jest najczęściej odgadywane. Dokładne algorytmy są, w rzeczywistości, bardziej skomplikowane. Chciałem tylko przekazać sedno pomysłu. Cały smaczek jest w tym, że miliony ludzi codziennie dbając o swoje bezpieczeństwo w internecie, jednocześnie pomagają komputerom firmy Google w ratowaniu księgozbiorów na całym świecie. 


Programy OCR w połączeniu z programami do rozpoznawania obrazów (image recognition), coraz bardziej umożliwiają odczytywanie różnego rodzaju pismo. Nawet ręczne bazgroły. Znajdują też szerokie zastosowanie w różnych dziedzinach. Niektóre są bardzo wąskie i używane tylko przez służby, inne wręcz przeciwnie. Przykładem tego drugiego zastosowania może być aplikacja na smartfona, która tłumaczy napisy. Polega to na tym, że umieszczając w polu kamery smartfona jakiś napis np. na budynku, po użyciu tłumacza, możemy ten sam napis zobaczyć w rodzimym języku. Jest to aplikacja, która z pewnością się przyda osobom podróżującym za granicę. 


Można z tego wyciągnąć wniosek: “nie ma tego złego co by na dobre nie wyszło”. Nawet jeśli hakerzy i spamerzy są utrapieniem dla społeczności internautów, to ich złe zachowanie wywołuje działania obronne. I przyczynia się do rozwoju technologii.


Komentarze

Prześlij komentarz

Popularne posty z tego bloga

Ciekawostki. Rzeki Babilonu Boney M 1979 Sopot

Rivers of Babylon  Boney M Większość popularnych piosenek krąży tematycznie wokół miłości. Dlatego słuchając przebojów w oryginalnej wersji czasem trudno skojarzyć, że teksty niektórych mogą być naprawdę zaskakujące. Kiedy przetłumaczyłem mojej znajomej tekst piosenki Leonarda Cohena "Who by fire" i okazało się, że słowa nie są wcale o miłości, tylko o umieraniu, to stwierdziła, że jest rozczarowana. Zauroczona wpadającą w ucho melodią i głosem Cohena, była przekonana, że w piosence są wątki dotyczące uczucia pomiędzy mężczyzną i kobietą. Okazało się, że nic z tych rzeczy. Zapraszam do wysłuchania wersji Boney M - Sopot 1979, a podczas słuchania można przeczytać tekst poniżej, wyjaśniający o czym właściwie jest ta piosenka.   Podobnie jest z piosenką Rivers of Babylon w wykonaniu Boney M. Zespół ten kojarzy się raczej z muzyką lekką i dyskotekową. Słuchając piosenki zawsze miałem skojarzenia bardzo przyjemne, w nastrojach gorącego lata i wakacji.  Nie przywodziła na myśl jaki

Technologie. Klawiatura komputera - podstawowe fakty

Niedoświadczonym użytkownikom komputera warto się zapoznać ze sprawami, które nie są intuicyjne i łatwe do samodzielnego odkrycia podczas klikania. Klawiatura jako urządzenie, jest tego przykładem. W swojej praktyce spotkałem się z osobami, którym najprostsze funkcje klawiatury były nieznane. Gwoli sprawiedliwości, trzeba powiedzieć, że nie odnosi się to jedynie do osób starszych. Zdarzyło mi się zaobserwować sytuacje, kiedy osoby w wieku lat dwudziestu kilku do napisania wielkiej litery włączały caps lock. Wbrew pozorom jednak obsługa klawiatury komputera jest nieskomplikowana. Trzeba zapamiętać dosłownie garstkę informacji, żeby usprawnić użytkowanie tego urządzenia. Komputer jest maszyną przetwarzającą informację. Musi być więc wyposażony w urządzenia do przyjmowania informacji i oddawania informacji. W dodatku te urządzenia muszą być przyjazne dla użytkownika. Zbiorczo do tych urządzeń używana jest nazwa interfejs, od angielskiego interface (wym. interfejs) Jest kilka rodzaj

Gify na świąteczne laurki

Gify to małe ruchome obrazki wyświetlane najczęściej na stronach internetowych. Zasada działania gifu polega na złożeniu kilku zdjęć – każde różni się nieco od pozostałych – i wyświetlaniu po kolei w krótkich odstępach czasu.  Być może pamiętacie z dzieciństwa zabawki z kartką i ołówkiem, gdzie poruszając szybko ołówkiem tak, żeby raz była widoczna, raz druga karteczka uzyskać wrażenie ruchu.