Documenti di testo: da PDF ad immagini vettoriali

Oggetto di questo articolo

Recentemente ho avuto necessità di convertire alcuni documenti in formato PDF, contenti testo generato da LaTeX in sistemi operativi GNU/Linux, in immagini vettoriali.

Evitando la conversione da servizi online, ho trovato sostanzialmente tre soluzioni interessanti: due a linea di comando (pdf2svg e pdftocairo) ed una, famosissima, di tipo grafico (inkscape).

In questo articolo riporto la mie valutazioni evidenziando alcune differenze derivante dalla fonte dei documenti in PDF e dal comportamento di tre distribuzioni Linux.

Alcuni riferimenti interessanti sull’argomento:

pdf2svg

È un software a linea di comando, semplicissimo da utilizzare, affidabile e veloce.

Questo è lo schema di utilizzo:

pdf2svg <in file.pdf> <out file.svg> [<page no>]

Come risulta dallo schema di utilizzo, è possibile specificare il numero di pagina da esportare.

Ideale per operazioni rapide e dirette da PDF a SVG.

Non esporta in altri formati ma se occorre semplicemente esportare un PDF in immagine vettoriale è la soluzione più veloce ed efficace.

Segnalo, in ogni caso, che l’autore del programma sembra non incoraggiare l’utilizzo di questo software.

Nella home page di pdf2svg si legge il seguente frammento:

Note: since this utility was written, the maintainers of Poppler have written a utility that works on the same principle: pdftocairo. I recommend that you use their utility since it is better maintained than mine.

Ovvero:

Nota: da quando è stata scritta questa utility, i manutentori di Poppler hanno scritto una utility che funziona sullo stesso principio: pdftocairo. Vi raccomando di usare la loro utility poiché è meglio mantenuta della mia.

pdftocairo

Altro software a linea di comando. Trattasi, in particolare, proprio di quello consigliato dall’autore di pdf2svg, come da frammento sopra menzionato.

Fa parte del pacchetto poppler-utils e potrebbe già essere stato installato di default nella vostra distribuzione Linux.

Molto ricco di opzioni, con la possibilità di esportare in vari formati e non solo in .svg.

Lo schema di utilizzo è il seguente:

pdftocairo [options] PDF-file [output-file]

Ma non è esente da problemi.

In Fedora e Arch Linux l’esportazione di PDF generati (solo) da LaTeX e convertiti verso .svg ha prodotto pagine bianche.

Il problema viene segnalato in rete da altri utilizzatori, come in questo post.

L’esportazione in altri formati immagine (.jpg e .png) non ha dato, invece, alcun problema.

Come anche nessun problema ho riscontrato esportando verso .svg documenti di testo generati da fonti diverse da LaTeX (ad esempio documenti generati da LibreOffice Writer).

In Fedora il problema è scomparso dopo l’installazione consigliata in questa pagina, ovvero:

$ sudo dnf install perl-File-Copy

In Arch Linux, invece, l’installazione del componente non funziona e genera la risposta “Could not find all required packages”.

Per tale distribuzione non ho trovato, quindi, alcuna soluzione, anche se sono quasi certo che ne esista una (se qualche lettore avesse risolto questo problema in Arch chiedo di farmelo sapere).

In Linux Ubuntu il problema non si è mai verificato sin dal primo utilizzo.

Inkscape

Per la gestione delle immagini vettoriali, in genere, Inkscape è il riferimento assoluto.

Il software consente, tra le infinite funzioni, anche di aprire i PDF, scegliendo la pagina specifica da visualizzare e, addirittura, il metodo di conversione e di salvare il risultato in formato .svg.

Il vantaggio è quello di avere immediamente l’immagine vettoriale disponibile per modifiche ed elaborazioni.

Il formato vettoriale (.svg), infatti, consente di estrarre, spostare, mescolare i frammenti di testo nelle immagini, come se fossero “post-it” digitali.

In sintesi

  • pdf2svg per operazioni veloci esclusivamente verso il formato .svg.
  • pdftocairo per operazioni che coinvolgono anche altri formati immagine.
  • Inkscape per esportazione e modifiche contestuali delle immagini vettoriali.

Grazie per la vostra attenzione.

Pubblicato in origine su https://francopasut.netlify.app

Commenti

Post popolari in questo blog

PCT e collegamenti ipertestuali tra atti e documenti in Word, Writer e LaTeX

Atti giudiziari: utilizzare le variabili al posto dei nomi propri in Word, Writer e LaTeX