[c#]Estrarre degli indirizzi da pagina html

giovedì 12 giugno 2008 - 14.41

program Profilo | Junior Member

Ciao, vorrei realizzare in c# un programmino che ricevuto in ingresso un file html lo analizzi pescando tutti gli indirizzi web contenuti che magari iniziano in un certo modo.....

Come posso fare?
Grazie.

0v3rCl0ck Profilo | Guru

>Ciao,

Ciao

>vorrei realizzare in c# un programmino che ricevuto in
>ingresso un file html lo analizzi pescando tutti gli indirizzi
>web contenuti che magari iniziano in un certo modo.....
>
>Come posso fare?

Ti consiglio di utilizzare le regular expression.

Ad esempio per trovare tutte le occorrenze di url completi potresti utilizzare questa regex:

Il codice sorgente non è stato renderizzato qui
perchè non c'è sufficiente spazio.
Clicca qui per visualizzarlo in una nuova finestra

Oppure più in specifico per trovare tutti gli href dei link e gli url delle immagini:

Il codice sorgente non è stato renderizzato qui
perchè non c'è sufficiente spazio.
Clicca qui per visualizzarlo in una nuova finestra

Con le regular expression puoi fare davvero tanto, sono comode, veloci, ma purtroppo non tanto intuitive. Dai uno sguardo al mio blog (http://blogs.dotnethell.it/regulator) troverai qualche articolo sul mondo regex, purtroppo non ho molto tempo per aggiornarlo spesso, però prima o poi scriverò altri articoli

>Grazie.

Prego

- Michael -
http://blogs.dotnethell.it/Regulator/
Partecipa anche tu! Registrati!
Hai bisogno di aiuto ?
Perchè non ti registri subito?

Dopo esserti registrato potrai chiedere
aiuto sul nostro Forum oppure aiutare gli altri

Consulta le Stanze disponibili.

Registrati ora !
Copyright © dotNetHell.it 2002-2024
Running on Windows Server 2008 R2 Standard, SQL Server 2012 & ASP.NET 3.5