Home Page
Articoli
Tips & Tricks
News
Forum
Archivio Forum
Blogs
Sondaggi
Rss
Video
Utenti
Chi Siamo
Contattaci
Username:
Password:
Login
Registrati ora!
Recupera Password
Home Page
Stanze Forum
App. WinForms / WPF .NET
Leggere un file pdf con vb.net
martedì 11 aprile 2006 - 08.04
Elenco Threads
Stanze Forum
Aggiungi ai Preferiti
Cerca nel forum
escaflowne
Profilo
| Junior Member
180
messaggi | Data Invio:
mar 11 apr 2006 - 08:04
Ciao a tutti,
esiste un modo per fare il parsing di un file pdf? Ho provato a salvarlo in txt ma taglia tutte le tabulazioni e, di fatto, è inutile.
Ho provato anche tool di conversione del pdf in word ma elimina i tab allo stesso modo
Grazie a tutti
Brainkiller
Profilo
| Guru
7.999
messaggi | Data Invio:
mer 12 apr 2006 - 10:42
>Ciao a tutti,
>esiste un modo per fare il parsing di un file pdf? Ho provato
>a salvarlo in txt ma taglia tutte le tabulazioni e, di fatto,
>è inutile.
>Ho provato anche tool di conversione del pdf in word ma elimina
>i tab allo stesso modo
Esattamente, è questo il problema.
Teoricamente il file PDF al suo interno è strutturato quindi dovrebbero esserci posizioni del testo paragrafi ecc. Non conosco però nessuna libreria che ti faccia un parsing di questo tipo anche se è possibile che esista.
ciao
David De Giacomi
Microsoft MVP
http://blogs.dotnethell.it/david/
escaflowne
Profilo
| Junior Member
180
messaggi | Data Invio:
mer 12 apr 2006 - 15:09
>Esattamente, è questo il problema.
>Teoricamente il file PDF al suo interno è strutturato quindi
>dovrebbero esserci posizioni del testo paragrafi ecc. Non conosco
>però nessuna libreria che ti faccia un parsing di questo tipo
>anche se è possibile che esista.
>ciao
>
>David De Giacomi
>Microsoft MVP
>
http://blogs.dotnethell.it/david/
ti ringrazio per la risposta.
Strano che mai nessuno si sia posto il problema. Dunque sarebbe necessario sapere, almeno, com'è strutturato il pdf (se è uno standard ci sarà qualche documento a proposito) e cercare di farne il parsing.....hmmm... non mi sembra affatto facile però
Ma a che cavolo servono i convertitori in word se poi eliminano tutte le tabulazioni?
Brainkiller
Profilo
| Guru
7.999
messaggi | Data Invio:
gio 13 apr 2006 - 10:45
>ti ringrazio per la risposta.
>Strano che mai nessuno si sia posto il problema. Dunque sarebbe
>necessario sapere, almeno, com'è strutturato il pdf (se è uno
>standard ci sarà qualche documento a proposito) e cercare di
>farne il parsing.....hmmm... non mi sembra affatto facile però
Generalmente i dati si trasferiscono in altri formati più standard, vedi xml, csv, txt, ecc.
>Ma a che cavolo servono i convertitori in word se poi eliminano
>tutte le tabulazioni?
Eh, perchè in alcuni casi, su taluni PDF, la conversione avviene e da' risultati ottimi. Tutto ciò dipende da come viene creato il PDF.
ciao
David De Giacomi
Microsoft MVP
http://blogs.dotnethell.it/david/
Torna su
Stanze Forum
Elenco Threads
Partecipa anche tu! Registrati!
Hai bisogno di aiuto ?
Perchè non ti registri subito?
Dopo esserti registrato potrai chiedere
aiuto sul nostro
Forum
oppure aiutare gli altri
Consulta le
Stanze
disponibili.
Registrati ora !