Leggere un file pdf con vb.net

martedì 11 aprile 2006 - 08.04

escaflowne Profilo | Junior Member

Ciao a tutti,
esiste un modo per fare il parsing di un file pdf? Ho provato a salvarlo in txt ma taglia tutte le tabulazioni e, di fatto, è inutile.
Ho provato anche tool di conversione del pdf in word ma elimina i tab allo stesso modo

Grazie a tutti

Brainkiller Profilo | Guru

>Ciao a tutti,
>esiste un modo per fare il parsing di un file pdf? Ho provato
>a salvarlo in txt ma taglia tutte le tabulazioni e, di fatto,
>è inutile.
>Ho provato anche tool di conversione del pdf in word ma elimina
>i tab allo stesso modo

Esattamente, è questo il problema.
Teoricamente il file PDF al suo interno è strutturato quindi dovrebbero esserci posizioni del testo paragrafi ecc. Non conosco però nessuna libreria che ti faccia un parsing di questo tipo anche se è possibile che esista.
ciao

David De Giacomi
Microsoft MVP
http://blogs.dotnethell.it/david/

escaflowne Profilo | Junior Member


>Esattamente, è questo il problema.
>Teoricamente il file PDF al suo interno è strutturato quindi
>dovrebbero esserci posizioni del testo paragrafi ecc. Non conosco
>però nessuna libreria che ti faccia un parsing di questo tipo
>anche se è possibile che esista.
>ciao
>
>David De Giacomi
>Microsoft MVP
>http://blogs.dotnethell.it/david/

ti ringrazio per la risposta.
Strano che mai nessuno si sia posto il problema. Dunque sarebbe necessario sapere, almeno, com'è strutturato il pdf (se è uno standard ci sarà qualche documento a proposito) e cercare di farne il parsing.....hmmm... non mi sembra affatto facile però

Ma a che cavolo servono i convertitori in word se poi eliminano tutte le tabulazioni?

Brainkiller Profilo | Guru

>ti ringrazio per la risposta.
>Strano che mai nessuno si sia posto il problema. Dunque sarebbe
>necessario sapere, almeno, com'è strutturato il pdf (se è uno
>standard ci sarà qualche documento a proposito) e cercare di
>farne il parsing.....hmmm... non mi sembra affatto facile però

Generalmente i dati si trasferiscono in altri formati più standard, vedi xml, csv, txt, ecc.

>Ma a che cavolo servono i convertitori in word se poi eliminano
>tutte le tabulazioni?

Eh, perchè in alcuni casi, su taluni PDF, la conversione avviene e da' risultati ottimi. Tutto ciò dipende da come viene creato il PDF.
ciao


David De Giacomi
Microsoft MVP
http://blogs.dotnethell.it/david/
Partecipa anche tu! Registrati!
Hai bisogno di aiuto ?
Perchè non ti registri subito?

Dopo esserti registrato potrai chiedere
aiuto sul nostro Forum oppure aiutare gli altri

Consulta le Stanze disponibili.

Registrati ora !
Copyright © dotNetHell.it 2002-2025
Running on Windows Server 2008 R2 Standard, SQL Server 2012 & ASP.NET 3.5