Ve studii Reading Digits in Natural Images with Unsupervised Feature Learning inženýři z Googlu společně s vědci ze Stanfordu zkoumali, jak si různé OCR mechanismy poradí s dekódováním číslic na přirozených fotkách. Klasické OCR algoritmy nefungovaly příliš dobře a chybovost byla velmi vysoká. Když ale nasadili systém umělé inteligence, který se postupně učil rozeznávat symboliku písma, na vzorku 500 tisíc fotografií nakonec vědci dosáhli až 90 procent úspěšnosti. Člověk přitom dosáhl úspěšnosti 98 procent.
Umělá inteligence si s vysokou úspěšností poradí prakticky se všemi čisly v běžných fotografiích|Umělá inteligence si s vysokou úspěšností poradí prakticky se všemi čisly v běžných fotografiích
OCR v tomto případě selhalo čistě proto, že se nejedná o ideální fotografie ze skeneru, ale skutečně o snímky pořízené z různých úhlů, o čísla třeba částečně překrytá zelení a snímky rozmazané.
Jak se neustále zlepšují nejrůznější statistické a AI algoritmy, cena dat, které Google v průběhu let nasbíral, neustále poroste, z fotografií se totiž podaří dekódovat stále více informací. Jestli je to v pořádku, nechť už posoudí každý z vás, lepší dokumentovaná technologie totiž může přirozeně pomoci i v automatizovaném prolamování testu CAPTCHA.