Content

Anti-spam maatregel reCaptcha zet zich in voor “de goede zaak” door het ontcijferen van oude boeken

Iedereen kent het Captcha principe wel. Dat zijn die leuke vakjes met allerlei misvormde letters en cijfers die spambots moeten tegenhouden bij de poort van je website. Een goede maatregel om spam te voorkomen, maar verder een volstrekt nutteloze exercitie. Onderzoekers op de Carnegie Mellon universiteit hebben er iets op bedacht.

reCaptcha

De uitkomst is een techniek die reCaptcha heet. Simpel gesteld zijn er een heleboel oude boeken ingescand die met behulp van geautomatiseerde technieken als OCR moeilijk te ontcijferen zijn.

Het menselijk brein is echter veel beter in het herkennen van letters, cijfers en woorden. Daarom worden er in plaats van random gegenereerde letter/cijfercombinaties nu stukjes uit deze boeken getoond. Grote sites als Twitter en Facebook hebben deze nieuwe methode al geïntegreerd. En waarom ook niet; zonde om al die energie verloren te laten gaan..

Bang dat de content opraakt hoef je in ieder geval niet te zijn. Volgens de onderzoekers zijn er nog 100 miljoen boeken in te scannen wat met het huidige tempo ongeveer 400 jaar zou duren.

2 Reacties

Leave a Reply

This form accepts XHTML input. You can use the following codes:

Links <a href="blog.iamthemedia.nl" title=""></a>
Bold <b></b>
Italic <i></i>

Een blog over allerhande zaken op het internet, afgewisseld met een snufje nieuws en opinie.

Wil je op de hoogte blijven van nieuwe artikelen? Abonneer je gratis per rss feed of per email.