Spamovací roboti chytřejší než lidé

5. 10. 2007

Doba čtení: 3 minuty

Systém CAPTCHA měl sloužit k rozlišení návštěvníků stránek na roboty a lidi. Proč by však lidé měli obrázky rozeznávat lépe než programy? Nedá se vyjít naopak z toho, že na rozdíl od softwarových robotů jsou naše schopnosti omezenější? Turingův test lze přece použít oběma směry...

Ilustrace: Nenad Vitas

Technologie zvaná CAPTCHA byla na Lupě probírána již opakovaně. O tom, že je někdy těžké najít kompromis mezi nečitelností symbolů v obrázku pro roboty a jejich čitelností pro běžné uživatele, pojednává například tato zprávička. Kritice uživatelů zde byla vystavena SMS brána Vodafonu, a to kvůli často se překrývajícím číslicím. Osobně musím přiznat, že na podobné problémy jsem v poslední době několikrát narazil i u brány O2. Zde se mi zase stávalo, že obrázek byl zčásti překryt formulářem, takže první číslice byla prakticky nečitelná.

Zde se mimochodem nabízí možnost, jak roboty ošálit. Předpokládám, že při rozpoznávání textu v obrázku pomocí OCR se robot soustředí nikoliv na celou stránku, ale analyzuje pouze příslušný obrázek. Není pak nic jednoduššího, než ho záměrně trochu posunout, aby člověk neviděl, a tedy ani neopsal, celý text. No a pokud by se zase roboti pustili do analýzy celé stránky a skenovali určitý definovaný prostor, lze umístění obrázku zase náhodně posunovat. Tohle zmiňuji ale jen na okraj, nepředpokládám, že by to na delší dobu pomohlo (ovšem válka se spamovacími roboty se dá chápat jako věčná, takže dočasné vítězství je možná prostě maximum, v co lze doufat). Už asi před rokem se v diskusi k původní zprávičce na Lupě objevil názor, že spíše než se snažit rozpoznat text v obrázku mohou spamovací roboty zkusit rozpoznat způsob, podle něhož je tento kód generován. A samozřejmě jsou tu i další problémy, např. zobrazení konkrétních překryvů by mohlo být ovlivněno třeba typem prohlížeče apod.

Co to ale zkusit naopak? V úvahách Alana Turinga o rozlišení člověka a stroje (mnohé z nich předcházely zveřejnění jeho nejslavnějšího článku Computing Machinery and Intelligence, v němž byl v roce 1950 navržen vlastní Turingův test ve formě imitační hry) upozorňoval britský matematik na rozdíly, které vyplývají z toho, že počítače jsou naopak dokonalejší než lidé.

Konkrétně Alan Turing ve svých textech zmiňuje dva aspekty:

rychlost provádění početních operací,
bezchybnost počítačových postupů.

Sčítat čísla rychleji než člověk dokázaly stroje už v době, která je z hlediska dnešního chápání dějin počítačů naprostou prehistorií (Pascalův stroj apod.). Z hlediska bezchybnosti výpočtu je pak člověku nadřazená i obyčejná kalkulačka.

A tak mě napadá: co to zkusit naopak? Co založit rozlišení regulérního uživatele od spamovacího robota naopak na tom, že člověk zvládne určitý úkol hůře? Obrázek pro rozpoznávání by mohl být pro člověka občas třeba záměrně nesrozumitelný, ovšem tak, aby ho pokročilá technologie OCR zvládla (nedokonalé OCR technologie by pak mohly být vyřazeny v dalším kole).

Jiný příklad: uživatel by musel vynásobit čtyřmístná čísla a testovala by se doba, kterou to zabralo (pro inzerenty by se pak navíc mohlo argumentovat, že to je také doba, po kterou bude uživatel sledovat reklamu). Příliš rychlá odpověď by byla kupodivu chybou.

Samozřejmě ani tohle nepředstavuje konečné řešení. Jak upozorňoval již Alan Turing, není problém počítač naprogramovat tak, aby nějaké výsledky oznamoval až se zpožděním, nebo dokonce občas „udělal chybu“ – tj. na výstupu se objevil jiný výsledek, než ke kterému došel algoritmus. Nicméně popsaný přístup se mi jeví stejně docela oživující a mohl by do souboje spamových a antispamových technologií vnést nové prvky. Z hlediska nezúčastněného pozorovatele by pak sledování tohoto souboje mohlo být ještě zábavnější než dnes, i když uživatelé by z těchto „inovací“ nutně radost mít nemuseli. Například pro geniální matematiky (či lidi extrémně bystrozraké) by se služba rázem stala nepoužitelnou. Ostatní by pak možná zase byli frustrováni tím, že se po nich vyžaduje splnění úkolu sestaveného tak, aby byl pro člověka nesplnitelný, a naštvaně by příslušnou webovou stránku opustili.

Uvedené příklady byly každopádně jen hříčky, nicméně by snad mohly existovat sofistikovanější varianty těchto postupů, které by lidského uživatele dokázaly odlišit právě podle toho, že člověk určité věci nedokáže nebo dokáže hůře než čím dál chytřejší programy. Udělat přednost z toho, že lidé jsou v řadě ohledů nedokonalí…

Vstoupit do diskuse (48 názorů)

Pavel Houser

Autor je redaktorem Sciencemag.cz.

Témata:

Glosa

K poslednímu bodu - musím zopakovat, že to je jen otázka vynaložených prostředků vs. efekt. Naprogramovat to zřetězení dvou akcí není naprosto žádný problém (ta sémantická analýza textu naproti tomu ano), to, že jste se s tím zatím nesetkal, je dáno tím, že je dost jiných webů nechráněných nebo chráněných špatně. Např. na Guru.com se objevují denodenně požadavky na tvorbu různých anti-captcha, ocr, user agentů apod., a sám jsem několik dělal (většinou specialitky typu online casina, mmorpg)

bez přezdívky

Sdílet

Autor článku

Pavel Houser

Témata:

Komerční sdělení

INTERNET CZ: První certifikovaný registrátor domén .cz podle nových kritérií CZ.NIC

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Vyzkoušeli jsme školu smyku ve FlixBusu. Problémem jsou nepřipoutaní pasažéři

Aby energetická transformace nebyla „teror“. Skupina TEDOM nově nabízí komplexní řešení pro malé a…

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Kdo odpovídá za škodu v důsledku zřícení budovy nebo pádu její části?

Podrobná mapa jižního pólu Měsíce. Brněnská společnost TRL Space bude stát v čele evropské vesmírné…

Oznámení o osvobozených příjmech: Shrnutí povinností pro fyzické osoby

Pokud potřebujete půjčit v korunách, nemusíte kvůli tomu prodávat bitcoiny. Můžete je zastavit

Rozmach létajících taxíků se stále nekoná. Evropským firmám, které je vyvíjejí, totiž postupně…

Spamovací roboti chytřejší než lidé

Sdílet

Autor článku

Čtěte dále

Komerční sdělení

Podcast

Mohlo by vás zajímat

Z našich webů

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Vyzkoušeli jsme školu smyku ve FlixBusu. Problémem jsou nepřipoutaní pasažéři

Aby energetická transformace nebyla „teror“. Skupina TEDOM nově nabízí komplexní řešení pro malé a…

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Kdo odpovídá za škodu v důsledku zřícení budovy nebo pádu její části?

Podrobná mapa jižního pólu Měsíce. Brněnská společnost TRL Space bude stát v čele evropské vesmírné…

Oznámení o osvobozených příjmech: Shrnutí povinností pro fyzické osoby

Pokud potřebujete půjčit v korunách, nemusíte kvůli tomu prodávat bitcoiny. Můžete je zastavit

Rozmach létajících taxíků se stále nekoná. Evropským firmám, které je vyvíjejí, totiž postupně…

Dále u nás najdete

Přílišné uklízení škodí plicím stejně jako cigarety

Vyhněte se chybám a prodlužte životnost USB flash disku

Deepl nově umí překládat v reálném čase řeč

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Lékárníci v karavanu anonymně změří cholesterol i cukr v krvi

Stříteský: Obchodníci mají v zahraničí vyšší sankce a omezené slevy

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

Svařák bez alkoholu je skvělá varianta pro těhotné či abstinenty

Oznámení o osvobozených příjmech: shrnutí povinností

Novu nebude tvořit AI. A umělé moderátory v ČRo nečekejte

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Chrome OS se zřejmě promění v Android

Souvisí zákaz Huawei i s nákupem stíhaček F-35?

Nejlepší dobou, kdy začít péct perníčky, je měsíc před Vánoci

World of Warcraft slaví 20 let a stále se hraje

Biolog zasvětil život lanýžům. Poznejte ho i s jeho psí parťačkou

Potíže, které dříve znamenaly neplodnost, umí lékaři vyřešit

Bolest prsu nemusí hned značit vážné onemocnění