Leonardo.it

I say blog!


  • 05
  • Ott

Come preservare i libri con un software antispam

Di Daniele Semeraro (D@di), in Curiosità, Software.

Cap

Un tool utilizzato per combattere lo spam aiuterà presto i ricercatori universitari a preservare dall’usura antichi testi e manoscritti. Molti siti web, come tutti noi sappiamo, utilizzano dei test automatici che chiedono all’utente, data una parola scritta in modo distorto o sfocato, di riscriverla in un campo di testo. Un “test” che serve principalmente per dare sicurezza al sito Web che colui che si sta iscrivendo a un determinato servizio o che sta facendo il login sia effettivamente una persona “umana” e non un sistema automatizzato.

Ebbene, non tutti lo sanno ma questo test, chiamato Captcha (Completely Automated Turing Test To Tell Computers and Humans Apart), è stato creato in origine dai ricercatori della Carnegie Mellon University per aiutare i computer a decifrare parole che i sistemi elettronici non possono leggere e permettendo ai diversi siti di utilizzarlo per combattere lo spam. Vediamo un po’ meglio in che modo.



Il lavoro dei ricercatori è quello di digitalizzare libri antichi e manoscritti (in modo da renderli “eterni”). Gli strumenti a disposizione sono il personale e il supporto di un’associazione no-profit, la “Internet Archive”, e un potente software Ocr (che esamina le pagine scannerizzate e le tramuta in testo). Purtroppo, però, il sistema Ocr non riconosce un decimo delle parole a causa della cattiva qualità dei documenti originali. Ecco che entra in scena il Captcha: le parole che il computer non riconosce vengono automaticamente distribuite nei siti affiliati in tutto il mondo - che li utilizzano come abbiamo visto per far autenticare le persone - che aderiscono al programma chiamato reCaptchas.

L’utente, quindi, registrandosi a un servizio pensa di riscrivere una parola apparentemente senza senso, ma in realtà sta aiutando i ricercatori a preservare antichi libri. Ovviamente, per evitare errori, ogni stringa di testo è sottoposta a due utenti: se le risposte sono uguali, allora la traduzione sarà accettata. I Captcha non sono molto popolari tra gli utenti internet: per molti sono una perdita di tempo e spesso sono difficili da decifrare. La prossima volta che vi imbattete in un Captcha, allora, non sbuffate: magari state aiutando la digitalizzazione di un testo del Trecento.

Via | Bbc News

9 Commenti Scritto da Daniele Semeraro (D@di)
Termini legati all'articolo: , , , , , , .
Altri articoli:

Articoli correlati a "Come preservare i libri con un software antispam"


Commenti:

Sono stati scritti 9 commenti su "Come preservare i libri con un software antispam"

  1. mi chiedo una cosa: ma se l’ocr non riesce a distinguere la parola, come fa il Captcha a funzionare correttamente? Cioè: se nemmeno chi ti propone il Captcha sa che parola è scritta, come può consentire all’utente di accedere all’area protetta?
    Scusate la forma, ma stanotte ho dormito poco!

  2. Se non sbaglio, delle due parole è solo la seconda quella che non viene identificata correttamente dall’ocr, quindi non influisce sul controllo anti-spam.

  3. DvD

    Che storia! Io proprio quella versione di Captcha mi stava un po’ antipatica perchè è veramente articolata! Adesso mi impegnerò un po’ meglio sapendo a cosa serve! :D

  4. SickByte

    @paoloc:
    trovi la spiegazione al tuo giusto interrogativo qui:
    http://recaptcha.net/learnmore.html

    (in pratica e’ come dice matteomac, solo spiegato in maniera piu’ esaustiva)

    Bella idea.

  5. Veramente utile come cosa, almeno i controlli antispam saranno più che utili..

  6. Giuseppe1000

    @paoloc
    Le parole che non vengono riconosciute non vengono esposte agli utenti come parola formata da lettere, ma come “immagine” della parola..quindi poi l’utente che vede quell’immagine e che riesce a leggere la parola contenuta(basta una lettera scritta male o qualche segno sopra la parola che il computer non capisce più niente, a differenza degli umani).

    Comunque credo che solo 2 utenti per parola sono pochi..minimo 4 o 5 per essere davvero sicuri

  7. Comunque questo progetto è vecchio, ne ho già sentito parlare un paio di mesi fa.

  8. Wow! e’ l’uovo di colombo!! ora che lo so mi vien voglia di aiutare!… affrontero’ i Captcha in modo diverso d’ora in poi!

  9. Non la sapevo sta cosa ^_^ Mai avuto niente in contrario verso i software anti-spam…ma almeno da adesso so che forse sto facendo qualcosa di costruttivo!


Categorie

Feed RSS
Tieniti sempre aggiornato, iscriviti ora ai Feed Rss.
Registrati & Login
Registrati ed identifica i tuoi commenti comodamente.
Newsletter
Inserisci il tuo indirizzo email per iscriverti alla Newsletter e ricevere tutti i nuovi post del blog:
Articoli in Evidenza
Tag Cloud 3D



I Blog del Network iSayBlog!