links for 2007-05-24 Observatie

CAPTCHA gebruiken om boeken te digitaliseren

Friday 25 May 2007 om 10u32

Geweldig idee, gelezen op slashdot. Ge kent allemaal CAPTCHA wel, dat ge cijfers en letters uit een tekening moet halen voordat ge een commentaar kunt achterlaten op websites of registreren, om er zeker van te zijn dat ge geen bot zijt.

Wel, nu is er iemand op het idee gekomen om daarmee boeken te digitaliseren. Ge scant een boek in, laat er nen OCR op los, en alles wat de OCR niet herkent gebruikt ge in een captcha. Een mens kan dat waarschijnlijk wel ontcijferen, en het resultaat van de captcha wordt ineens gebruikt om dat stuk tekst digitaal te krijgen.

Geweldig idee. En het is zelfs al in gebruik. Misschien ga ik dat hier op mijn blog wel eens installeren, kwestie van de spammers tegen te houden en ondertussen nog wa nuttigs te doen ook.

Gepost in: Tiens tiens

3 Commentaren Zelf commentaar toevoegen

  • 1. Steven  |  Friday 25 May 2007 om 10u40  |  Belgium
         Gepost met Firefox 2.0.0.3 op Windows XP

    serieus goe idee

  • 2. whacker  |  Friday 25 May 2007 om 12u31  |  Belgium
         Gepost met Firefox 2.0.0.3 op Windows XP

    ik typ da nie in ze poit, ge emt al akizmet of zoiet als spamfilter en da werkt 20 van de 21 keren

  • 3. Marnik  |  Friday 25 May 2007 om 13u07  |  Belgium
         Gepost met Firefox 2.0.0.3 op Windows XP

    Niks zo effectief als ne CAPTCHA, en veel minder load voor de server.

Laat commentaar achter

Vereist

Vereist, verborgen

Toegelaten HTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

Trackback  |  Volg de commentaren via de RSS-feed.


Recente Commentaar

Top Commenters (laatste maand)

Recente Posts

Categorieën

Archief

Links

Feeds