OCR PORTABILE E GRATUITO


  1. PREMESSA
  2. PREPARAZIONE
  3. ESTRAZIONE

Un ottimo programma GRATUITO di riconoscimento ottico dei PDF scansiti da origine cartacea.
Addirittura PORTABILE.
Non è affatto semplice trovare un progamma gratuito di OCR, ovvero che "estragga" il contenuto testuale dei PDF fotografici.
Ancora più difficile è trovarlo in modalità PORTABILE, ovvero senza esigenza di installazione su PC locale.
A chi può essere utile?
Il riconoscimento ottico è utile a tutti coloro che hanno a che fare, per lavoro, studio o altro, con PDF "fotografici", ovvero derivanti dall'acquisizione allo scanner di documenti cartacei.
Non è, invece, di alcuna utilità per i PDF derivanti da conversione diretta dai programmi di editing: in questo caso i caratteri sono già estraibili in modo nativo.
Inoltre capita che, per vincoli imposti in ambito aziendale o per ottimizzare i tempi, non sia possibile procedere all'installazione di programmi completi su PC locale.
É possibile attrezzare una chiavetta USB esterna con un programma gratuito che disponga della funzione di OCR senza significative limitazioni nella licenza d'uso.

Innanzitutto occorre scaricare e scompattare in una qualsiasi cartella, anche su chiavetta esterna USB, il programma PDF-XChange Editor in versione PORTABLE. Occorre, quindi, scaricare le LINGUE DI RICONOSCIMENTO dal sito del produttore; consiglio, oltre al paccetto OCR BASE già installato nella versione scaricata, anche il pacchetto di circa 80MB "All Languages Pack".
Lanciare l'eseguibile del Language Pack.
A questo punto appare l'avviso che NON risulta installato il software sul PC (ed è vero: non è installato sul PC ma su dispositivo portabile); basta proseguire e l'installatore chiede dove installare (ovvero decomprimere) il contenuto; indicate la sottocartella OCRLanguages (sotto PluginsData).
Una svolta scompattato si trova l'eseguibile nella cartella radice.
Dopo avere caricato un PDF occorre selezionare la funzione "Pagine OCR" dal menu DOCUMENTI.
Basta premere il pulsante OCR e indicare, nell'apposito campo di selezione, la lingua del documento.

Dopo la preparazione del software procediamo all'estrazione del contenuto dei PDF. Si apre un PDF e si seleziona la funzione "PAGINE OCR"
Appare la finestra delle opzioni in cui si può selezionare la lingua di riconoscimento:
Con "OK" si avvia la procedura di riconoscimento.
Al termine si ottiene un PDF con testo selezionabile e copiabile.
Il salvataggio del documento con il testo copiabile è riservato ai possessori della licenza PRO.
In ogni caso è possibile e pienamente legittimo selezionare il testo, copiarlo e incollarlo in un altro ambiente.

Commenti

Post popolari in questo blog

PCT e collegamenti ipertestuali tra atti e documenti in Word, Writer e LaTeX

Atti giudiziari: utilizzare le variabili al posto dei nomi propri in Word, Writer e LaTeX