Leggere campi di un file PDF

mercoledì 25 febbraio 2009 - 15.32

bujia Profilo | Newbie

Ciao!

Ho un file PDF che contiene alcuni dati, in particolare numeri e date... avrei bisogno di realizzare un programmino ad hoc che mi legge questi campi dentro al file PDF e in base a questi fa certe cose.
La mia domanda è: si riesce ad aprire in lettura un file PDF e ad estrarre delle informazioni specifiche, dei campi specifici al suo interno?
In pratica un gestionale avrà creato quel PDF in qualche modo a partire da alcuni dati... io vorrei fare il percorso inverso...
E' possibile con .NET? Altrimenti cosa si può usare?

Grazie mille.

Alessandro

alexmed Profilo | Guru

Ciao
Premetto che non l'ho testato (http://www.codeproject.com/KB/files/PDF_to_TEXT.aspx), una soluzione potrebbe essere quella di trasformare il PDF in file TXT.

Ciao

alexmed

llamanna Profilo | Junior Member

Se ho capito ti interessa fare un parse di in file pdf. Potresti intanto dare un'occhiata a questo link
http://csharp-source.net/open-source/pdf-libraries
dove vengono elencate delle librerie opensource per interagire con file pdf.
Io ho provato ad utilizzare la itextSharp, iniziando dall'esempio riportato in questo sito http://www.xtractpro.com/articles/PDF-File-Parser.aspx?page=2
Per approfondire ulteriormente puoi trovare altri esempi su http://www.codeproject.com/.

bujia Profilo | Newbie

Ciao!

Grazie della risposta... ma non sono riuscito a realizzare la cosa con il link che mi hai dato...

Potresti farmi un semplice esempio di codice c# usando iTextSharp che dato un file nomefile.pdf mi scrive in output quello che contiene il pdf?
In particolare io ho una fattura in pdf e mi aspetto che contenga qualche campo specifico... in particolare devo estrarre il codice cliente... ma non so nient'altro... ho solo il pdf... come devo fare per estrarlo?

Grazie mille dell'aiuto... e scusami... ma sono alle prime armi...

Alessandro

Alessandro

llamanna Profilo | Junior Member

Il tuo problema è ricavare le informazioni. Poichè il file pdf che tu disponi non è stato creato da te e quindi non ha uno specifico template, credo che sia un pò difficile, se non impossibile ottenere le informazioni di cui necessiti. Purtroppo non so darti per il momento una soluzione al tuo problema, perchè ho usato questa libreria non per leggere ma per scrivere su un file pdf.
Laura.
http://lauralamanna.blogspot.com/
Partecipa anche tu! Registrati!
Hai bisogno di aiuto ?
Perchè non ti registri subito?

Dopo esserti registrato potrai chiedere
aiuto sul nostro Forum oppure aiutare gli altri

Consulta le Stanze disponibili.

Registrati ora !
Copyright © dotNetHell.it 2002-2024
Running on Windows Server 2008 R2 Standard, SQL Server 2012 & ASP.NET 3.5