Google Docs: le migliorie applicate alla funzionalità OCR

Lo scorso anno Google aveva arricchito il suo servizio Docs ("Google Documenti", in italiano) con una funzionalità volta al riconoscimento ottico dei caratteri (OCR): grazie al prezioso strumento, il "wordprocessor" che risiede ed opera intera...

Lo scorso anno Google aveva arricchito il suo servizio Docs (“Google Documenti“, in italiano) con una funzionalità volta al riconoscimento ottico dei caratteri (OCR): grazie al prezioso strumento, il “wordprocessor” che risiede ed opera interamente sui server del colosso di Mountain View, è divenuto in grado di “trasformare” documenti acquisiti, ad esempio, con lo scanner in testi liberamente modificabili. Per avviare l’OCR, il documento originale, non modificabile, deve essere caricato online come file PDF o come una normale immagine (JPG, GIF o PNG).

La novità di queste ore è che Google ha aggiunto il supporto per ben 24 lingue aggiuntive. In questo modo, l’OCR integrato in Google Docs diviene più abile in fase di riconoscimento dei caratteri. I dizionari aggiornati, infatti, consentono di rilevare in modo più puntuale i termini contenuti nei documenti sottoposti ad esame e di migliorare i risultati ottenibili. Grazie all’inserimento delle 24 lingue addizionali – sia europee che asiatiche -, l’OCR di Google Docs porta a 34 il numero delle lingue complessivamente supportate.

Qualora voleste mettere alla prova l’OCR di Google e saggiarne, in prima persona, le abilità, è sufficiente effettuare il login al proprio account quindi collegarsi con questa pagina. Si dovrà quindi lasciare spuntata solamente la casella “Converti testo da file PDF o file di immagine nel formato di Google Documenti“. Il passo seguente consiste nella scelta dei file da sottoporre all’OCR (link “Seleziona più file“) quindi nella pressione del pulsante Avvia caricamento.

I file sottoposti al riconoscimento ottico dei caratteri non possono superare i 2 MB in termini di dimensione. Inoltre, nel caso dei file PDF, la “conversione” si concentrerà solo sulle prime dieci pagine del documento.

Altre informazioni sui software OCR sono disponibili in questi nostri articoli.

Ti consigliamo anche

Link copiato negli appunti