CAPTCHA gebruiken om boeken te digitaliseren
Friday 25 May 2007 om 10u32
Geweldig idee, gelezen op slashdot. Ge kent allemaal CAPTCHA wel, dat ge cijfers en letters uit een tekening moet halen voordat ge een commentaar kunt achterlaten op websites of registreren, om er zeker van te zijn dat ge geen bot zijt.
Wel, nu is er iemand op het idee gekomen om daarmee boeken te digitaliseren. Ge scant een boek in, laat er nen OCR op los, en alles wat de OCR niet herkent gebruikt ge in een captcha. Een mens kan dat waarschijnlijk wel ontcijferen, en het resultaat van de captcha wordt ineens gebruikt om dat stuk tekst digitaal te krijgen.
Geweldig idee. En het is zelfs al in gebruik. Misschien ga ik dat hier op mijn blog wel eens installeren, kwestie van de spammers tegen te houden en ondertussen nog wa nuttigs te doen ook.
Gepost in: Tiens tiens
3 Commentaren Zelf commentaar toevoegen
1.
Steven | Friday 25 May 2007 om 10u40 |
Gepost met Firefox 2.0.0.3 op Windows XP
serieus goe idee
2.
whacker | Friday 25 May 2007 om 12u31 |
Gepost met Firefox 2.0.0.3 op Windows XP
ik typ da nie in ze poit, ge emt al akizmet of zoiet als spamfilter en da werkt 20 van de 21 keren
3.
Marnik | Friday 25 May 2007 om 13u07 |
Gepost met Firefox 2.0.0.3 op Windows XP
Niks zo effectief als ne CAPTCHA, en veel minder load voor de server.
Laat commentaar achter
Toegelaten HTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>
Trackback | Volg de commentaren via de RSS-feed.