Recuperare del testo da una pagina Web

martedì 09 gennaio 2007 - 19.28

VESUSS Profilo | Newbie

Salve a tutti,
sto cercando di creare una applicazione in c# per recuperare del testo da una pagina web, riesco a recuperare líntera pagina con:

HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create("http://...");

e visualizzarla in poi in una richtextbox, ora vorrei sapere come faccio ad estrarre quello che c´é scritto entro i tag html se é possibile. So che ad esempio in php si puó estrarre un metatag in questo modo:

metatag = get_meta_tags ( 'http://...' );
print_r ( $metatag );

sará che esiste una cosa simile pure in c#??

Grazie mille per l´attenzione a presto.

ciao da mf.
VESUSS

VESUSS Profilo | Newbie

Ho trovato questo articolo molto interessante ora proveró a testare il codice cmq nel frattempo mi sono dato da fare e ho trovato una soluzione che mi sta andando bene + o -
ho provato a salvare l´intera pagina e poi ho cancellato tutti i tag recuperando cosí solo il testo :

public static string RemoveHtml(string text)
{
return Regex.Replace(text, "<[^>]*>", String.Empty);
}
public static string RemoveHtml2(string text)
{
return Regex.Replace(text, "&nbsp;", string.Empty);
}
Grazie ancora per l´aiuto!!!!!


VESUSS
Partecipa anche tu! Registrati!
Hai bisogno di aiuto ?
Perchè non ti registri subito?

Dopo esserti registrato potrai chiedere
aiuto sul nostro Forum oppure aiutare gli altri

Consulta le Stanze disponibili.

Registrati ora !
Copyright © dotNetHell.it 2002-2024
Running on Windows Server 2008 R2 Standard, SQL Server 2012 & ASP.NET 3.5