Cos'è lo User Agent
Chi lavora nel mondo dell'Information Technology lo conoscerà sicuramente, chi invece ha o gestisce un sito Web di medie dimensioni e fa statistiche lo conoscerà ancora meglio.
Lo User Agent è semplicemente una stringa di testo (una sequenza di caratteri) che rappresenta e identifica chi sta effettuando una richiesta al Web Server.
Di solito è composta dal nome del Browser e la versione e a volte anche dal nome del sistema operativo e relativa versione (come vedrete sotto Windows NT 5.1 per Windows XP, Windows NT 5.0 per Windows 2000, e così via).
Facciamo un po' di chiarezza quindi, un Web Server è un particolare programma che gira su un Server che riceve le richieste (di solito dai Browser degli utenti) per alcune pagine e le invia al richiedente.
Sono i programmi che hanno permesso al Web di esplodere. Il mondo del Web si suddivide praticamente su tre, quattro Web Server molto conosciuti, ne cito due,
Microsoft Internet Information Server (IIS) di Microsoft e
Apache che gira su Linux.
All'interno delle specifiche del protocollo HTTP quello usato per trasmettere queste pagine Web c'è anche indicato che è necessario specificare questo User Agent in tutte le richieste. Il vostro Internet Explorer aderisce a queste specifiche e quindi anche lui ad ogni richiesta si presenterà al Web Server dicendo: "Io voglio la pagina a.html e mi chiamo Internet Explorer 6.0".
Il Web Server accetterà o negherà la richiesta ed invierà la pagina richiesta.
Il Web Server immagazzina tutte queste richieste e li scrive su file di testo o binari chiamati
Log. Dal Web Log poi si possono costruire delle statistiche ed è qui che appariranno tutti gli User Agent in questo modo potremo vedere la percentuale di utenti che usano Internet Explorer, chi usa Netscape oppure Mozilla oppure ancora Opera o altri Browser.
Una tabella di statistiche
Vediamo qui di seguito alcuni User Agent molto comuni dei Browser Internet Explorer e Opera:
Mozilla/4.0 (compatible;
MSIE 6.0; Windows NT 5.1)
Opera/7.0 (Windows NT 5.1; U) [en]
Il particolare caso dei motori di ricerca
Anche i motori di ricerca hanno degli agenti chiamati
Crawler che scandagliano letteralmente tutto il Web disponibile e lo rendono disponibile nelle ricerche. Anche i Crawler fanno uso del protocollo TCP/IP e quindi anche loro lasciano la loro impronta, il loro User Agent quindi ne vediamo qui di seguito tre di tre famosi motori di ricerca, Google, Altavista e Fast (Lycos):
Googlebot/2.1 (+
http://www.googlebot.com/bot.html )
Scooter/3.2FAST-WebCrawler/3.6 (atw-crawler at fast dot no;
http://fast.no/support/crawler.asp )
Privacy, Statistiche, Indagini di Mercato
Tutto ciò sembra molto semplice ma spesso dietro a questi User Agent si nascondono secondi fini come statistiche e indagini di mercato. La nostra privacy seppur di poco viene violata.
Alcuni Browser come Opera permettono di modificare lo User Agent che viene inviato. Opera così può impersonare varie identità. Nel caso di Internet Explorer invece purtroppo una parte è fissa e una variabile. E' possibile scaricare particolari Proxy che in pratica sostituiscono lo User Agent con uno che decidiamo noi in modo da non far sapere ai siti su cui navighiamo che Sistema Operativo o Browser stiamo utilizzando.
Anche se sostituire lo User Agent garantisce un livello di Privacy più alto c'è anche da dire che alcuni siti su cui navigate potrebbero offrirvi meno funzionalità. Molti script infatti controllano il Browser che sta navigando e vi redirigono su pagine ottimizzate per la visualizzazione.