Leonardo.it

I say blog!

  • 05
  • ott

Come preservare i libri con un software antispam

Pubblicato da Daniele Semeraro (D@di)in Curiosità, Software | 5 ottobre, 2007 | 9:00 am
Cap

Un tool utilizzato per combattere lo spam aiuterà presto i ricercatori universitari a preservare dall’usura antichi testi e manoscritti. Molti siti web, come tutti noi sappiamo, utilizzano dei test automatici che chiedono all’utente, data una parola scritta in modo distorto o sfocato, di riscriverla in un campo di testo. Un “test” che serve principalmente per dare sicurezza al sito Web che colui che si sta iscrivendo a un determinato servizio o che sta facendo il login sia effettivamente una persona “umana” e non un sistema automatizzato.

Ebbene, non tutti lo sanno ma questo test, chiamato Captcha (Completely Automated Turing Test To Tell Computers and Humans Apart), è stato creato in origine dai ricercatori della Carnegie Mellon University per aiutare i computer a decifrare parole che i sistemi elettronici non possono leggere e permettendo ai diversi siti di utilizzarlo per combattere lo spam. Vediamo un po’ meglio in che modo.


Il lavoro dei ricercatori è quello di digitalizzare libri antichi e manoscritti (in modo da renderli “eterni”). Gli strumenti a disposizione sono il personale e il supporto di un’associazione no-profit, la “Internet Archive”, e un potente software Ocr (che esamina le pagine scannerizzate e le tramuta in testo). Purtroppo, però, il sistema Ocr non riconosce un decimo delle parole a causa della cattiva qualità dei documenti originali. Ecco che entra in scena il Captcha: le parole che il computer non riconosce vengono automaticamente distribuite nei siti affiliati in tutto il mondo – che li utilizzano come abbiamo visto per far autenticare le persone – che aderiscono al programma chiamato reCaptchas.

L’utente, quindi, registrandosi a un servizio pensa di riscrivere una parola apparentemente senza senso, ma in realtà sta aiutando i ricercatori a preservare antichi libri. Ovviamente, per evitare errori, ogni stringa di testo è sottoposta a due utenti: se le risposte sono uguali, allora la traduzione sarà accettata. I Captcha non sono molto popolari tra gli utenti internet: per molti sono una perdita di tempo e spesso sono difficili da decifrare. La prossima volta che vi imbattete in un Captcha, allora, non sbuffate: magari state aiutando la digitalizzazione di un testo del Trecento.

Via | Bbc News


Altri articoli:

Articoli correlati a "Come preservare i libri con un software antispam"



Commenti:

Sono stati scritti 10 commenti su "Come preservare i libri con un software antispam"

  1. mi chiedo una cosa: ma se l’ocr non riesce a distinguere la parola, come fa il Captcha a funzionare correttamente? Cioè: se nemmeno chi ti propone il Captcha sa che parola è scritta, come può consentire all’utente di accedere all’area protetta?
    Scusate la forma, ma stanotte ho dormito poco!

  2. Se non sbaglio, delle due parole è solo la seconda quella che non viene identificata correttamente dall’ocr, quindi non influisce sul controllo anti-spam.

  3. Che storia! Io proprio quella versione di Captcha mi stava un po’ antipatica perchè è veramente articolata! Adesso mi impegnerò un po’ meglio sapendo a cosa serve! :D

  4. SickByte

    @paoloc:
    trovi la spiegazione al tuo giusto interrogativo qui:
    http://recaptcha.net/learnmore.html

    (in pratica e’ come dice matteomac, solo spiegato in maniera piu’ esaustiva)

    Bella idea.

  5. Mangiucugna

    Veramente utile come cosa, almeno i controlli antispam saranno più che utili..

  6. Giuseppe1000

    @paoloc
    Le parole che non vengono riconosciute non vengono esposte agli utenti come parola formata da lettere, ma come “immagine” della parola..quindi poi l’utente che vede quell’immagine e che riesce a leggere la parola contenuta(basta una lettera scritta male o qualche segno sopra la parola che il computer non capisce più niente, a differenza degli umani).

    Comunque credo che solo 2 utenti per parola sono pochi..minimo 4 o 5 per essere davvero sicuri

  7. Comunque questo progetto è vecchio, ne ho già sentito parlare un paio di mesi fa.

  8. Wow! e’ l’uovo di colombo!! ora che lo so mi vien voglia di aiutare!… affrontero’ i Captcha in modo diverso d’ora in poi!

  9. Goradan

    Non la sapevo sta cosa ^_^ Mai avuto niente in contrario verso i software anti-spam…ma almeno da adesso so che forse sto facendo qualcosa di costruttivo!

  10. [...] reCAPTCHA: coniugare esigenze pratiche, quali la protezione di un blog dallo spam, ed iniziative utili alla collettività è estremamente difficile ma questo strumento ci riesce alla grande. Si tratta infatti di un sistema CAPTCHA (quel tipo d test che, per accertarsi di avere a che fare con una persona e non con un sistema automatizzato, chiede all’utente di scrivere determinate parole in un apposito spazio prima di accettare i suoi commenti) che, al contrario di quello che sembra, non ci fa digitare parole a casaccio, bensì dei termini che consentono di completare l’opera di digitalizzazione di alcuni importanti libri. [...]




Il network di ISayBlog!


Diventa fan di Geekissimo su Facebook!

Gallery

Windows 8


Consigliaci su Google!

Archivi

Categorie