Co je CAPTCHA a proč se používá?

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) byl původně navržen k odlišení lidí od strojů. Tyto testy byly vytvořeny s předpokladem, že některé vizuální a rozpoznávací úkoly jsou pro člověka jednoduché, ale pro počítače obtížné. Tradičně to fungovalo – přeskakování mezi fotkami přechodů nebo náklaďáků bylo něco, co většina robotů nezvládla. Ale to už přestává platit.

Nové modely umělé inteligence

Výzkumný tým se zaměřil na známou verzi CAPTCHA, kterou většina z nás zná z webů – reCAPTCHA v2 od Googlu. I když Google postupně přešel na novější reCAPTCHA v3, která se více spoléhá na analýzu interakce uživatele s webem než na explicitní výběr obrázků, starší verze je stále hojně využívána na milionech webových stránek.

Tým použil model YOLO (You Only Look Once), známý svou schopností detekovat objekty v reálném čase. Po tréninku modelu na 14 000 obrázcích s dopravními prvky, jako jsou semafory nebo přechody, byli výzkumníci schopni vytvořit systém, který rozpoznává CAPTCHA obrázky s až 100% úspěšností, a to u některých kategorií, jako jsou například požární hydranty.

Pro složitější úkoly, jako je identifikace objektů na segmentovaných obrázcích, použili další modely. Výzkumníci zároveň nasadili různé triky, aby systém zmátli – používali VPN pro skrývání opakovaných pokusů ze stejné IP adresy, napodobili lidské pohyby myši a simulovali prohlížení reálného webu.

100% úspěšnost: co to znamená pro budoucnost CAPTCHA?

Tato nová úroveň úspěšnosti znamená, že hranice mezi tím, co stroj zvládne a co ne, se rychle stírá. Výzkumníci dosáhli úspěšnosti, která se pohybovala od 69 % (například u motocyklů) až po 100 % (u hydrantů). To vše znamená, že CAPTCHA, jak ji známe dnes, ztrácí svou účinnost. Pokud robot dokáže projít testem lépe než průměrný uživatel, znamená to, že jsme oficiálně vstoupili do nové éry, kde tradiční metody ochrany webu nestačí.

Bitva pokračuje: jaké jsou další kroky?

Tento vývoj v oblasti AI ale není zcela nový. Již v roce 2008 vědci prokázali, že roboti mohou být trénováni na překonání zvukových CAPTCHA, které byly určeny pro zrakově postižené uživatele. V roce 2017 zase neuralní sítě prolomily textové CAPTCHA, které vyžadovaly opisování zkreslených písmen. A dnes, s nástupem AI, které dokážou rozpoznávat obrázky s přesností srovnatelnou s člověkem, se vývoj posouvá směrem k jemnějším metodám identifikace uživatelů.

Google se již zaměřil na systémy, které nevyžadují vizuální výzvy. Spuštěním reCAPTCHA v3 v roce 2018 se snaží detekovat chování uživatele na webu a tím rozpoznat, zda jde o člověka nebo robota. A jak se AI systémy zlepšují, bude potřeba neustále vylepšovat i ochranu.

Zdroj: Shutterstock

Jak zůstat krok před stroji?

Zatímco CAPTCHA byla po léta považována za hranici mezi tím, co stroj zvládne a co ne, nové technologie tuto hranici zpochybňují. Bezpečnostní systémy budou muset hledat nové cesty, jak udržet boty mimo zabezpečené weby. Do budoucna se můžeme těšit na nové metody, které se budou více soustředit na analýzu lidského chování, biometrické ověřování nebo jiné formy detekce, které nebudou spoléhat na jednoduché úkoly jako rozpoznávání obrázků.

Pokud máte pocit, že vaše oblíbené stránky používají starou verzi CAPTCHA, může být na čase se zamyslet nad tím, zda je vaše data skutečně chráněna tak, jak by měla být. Umělá inteligence se totiž už teď začíná dostávat na úroveň, kdy dokáže překonat tyto obrany s lehkostí.