CAPTCHA gebruiken om boeken te digitaliseren
Geweldig idee, gelezen op slashdot. Ge kent allemaal CAPTCHA wel, dat ge cijfers en letters uit een tekening moet halen voordat ge een commentaar kunt achterlaten op websites of registreren, om er zeker van te zijn dat ge geen bot zijt.
Wel, nu is er iemand op het idee gekomen om daarmee boeken te digitaliseren. Ge scant een boek in, laat er nen OCR op los, en alles wat de OCR niet herkent gebruikt ge in een captcha. Een mens kan dat waarschijnlijk wel ontcijferen, en het resultaat van de captcha wordt ineens gebruikt om dat stuk tekst digitaal te krijgen.
Geweldig idee. En het is zelfs al in gebruik. Misschien ga ik dat hier op mijn blog wel eens installeren, kwestie van de spammers tegen te houden en ondertussen nog wa nuttigs te doen ook.
3 commentaren May 25th, 2007