Tutte le volte che lavorate al PC, navigate dal tablet o gestite un sito su un server, ci sono numerosi processi che avvengono in back­ground, senza che ve ne ac­cor­gia­te. Se sorgono problemi, si ri­scon­tra­no degli errori o volete capire quali pro­ce­di­men­ti eseguono il sistema operativo e gli altri programmi, potete con­trol­la­re i log, che vi daranno in­for­ma­zio­ni in merito. Vengono uti­liz­za­ti au­to­ma­ti­ca­men­te da quasi tutte le ap­pli­ca­zio­ni, i server, i database e i sistemi, di cui re­gi­stra­no tutti i processi più im­por­tan­ti.

In genere i file di log vengono ana­liz­za­ti solo di rado, come una scatola nera di un aereo, che viene esaminata solo in casi ec­ce­zio­na­li. Grazie alla det­ta­glia­ta ac­qui­si­zio­ne di dati, i log risultano molto utili per ricercare errori dei programmi e del sistema in generale, oltre che per rilevare il com­por­ta­men­to degli utenti. Questa funzione non solo è in­te­res­san­te per gli svi­lup­pa­to­ri di software, ma lo è anche per i webmaster, che possono ricavare dai log delle in­for­ma­zio­ni utili sul loro web server.

Che cos’è un file di log?

I log, che svolgono la funzione di registro di eventi, sono dei comuni file di testo, dove sono re­gi­stra­ti tutti i processi, definiti rilevanti dal pro­gram­ma­to­re dell’ap­pli­ca­zio­ne. Nel caso dei log di un database sono ad esempio da ritenersi im­por­tan­ti tutte le modifiche delle tran­sa­zio­ni concluse cor­ret­ta­men­te. Se a causa di un crash, vengono can­cel­la­te delle parti del database, il file di log serve per ri­pri­sti­na­re il tutto.

I file di log vengono generati au­to­ma­ti­ca­men­te secondo i comandi dati in fase di pro­gram­ma­zio­ne; se si hanno le giuste co­no­scen­ze, è anche possibile creare dei propri log. Una riga di un log comprende ge­ne­ral­men­te le seguenti in­for­ma­zio­ni:

  • Evento avvenuto (ad esempio avvio di un programma)
  • Data e orario dell’evento

Di solito gli eventi sono ordinati in ordine cro­no­lo­gi­co e quindi viene mostrato per prima l’orario.

Tipici usi dei file di log

I sistemi operativi creano di default più file di log, in cui vengono re­gi­stra­ti e clas­si­fi­ca­ti vari tipi di processi. I sistemi Windows re­gi­stra­no ad esempio eventi relativi alle ap­pli­ca­zio­ni, al sistema, alla sicurezza, al set-up e ai rein­di­riz­za­men­ti. Gli am­mi­ni­stra­to­ri ricevono così in­for­ma­zio­ni utili per la ri­so­lu­zio­ne degli errori. Inoltre, nei log di Windows sono indicati gli utenti che si sono loggati o sloggati dal sistema. Oltre al sistema operativo, anche i seguenti programmi e sistemi rac­col­go­no diversi dati utili:

  • I programmi in back­ground come ad esempio mail server, database e proxy generano file di log, che re­gi­stra­no i messaggi di errore, avvisi e in­di­ca­zio­ni. In questo modo si vuole ottenere una certa sicurezza e con­sen­ti­re il ri­pri­sti­no dei dati.

  • I software in­stal­la­ti come Office, i giochi, i servizi di mes­sag­gi­sti­ca istan­ta­nea, i firewall o gli antivirus me­mo­riz­za­no diversi tipi di dati nei log. Si può trattare di con­fi­gu­ra­zio­ni o messaggi di chat, ma so­prat­tut­to anche in questo caso vengono re­gi­stra­ti tutti i crash che potranno essere ana­liz­za­ti per risolvere il problema.

  • I server (in par­ti­co­la­re i web server) re­gi­stra­no le attività di rete più im­por­tan­ti, che com­pren­do­no tutte le in­for­ma­zio­ni utili sull’utente e sul suo com­por­ta­men­to in rete. Inoltre gli am­mi­ni­stra­to­ri au­to­riz­za­ti possono sapere quali utenti hanno avviato un’ap­pli­ca­zio­ne o richiesto un file, a che ora l’hanno fatto, quanto è durata la loro attività e quale sistema operativo hanno uti­liz­za­to. L’analisi dei log del web server è uno dei metodi più uti­liz­za­ti di sempre per con­trol­la­re il web ed esem­pli­fi­ca l’utilità dei log files.

Un esempio del po­ten­zia­le dei file di log: i log del web server

Ori­gi­na­ria­men­te i log venivano usati dai web server, come Apache o Microsoft IIS, per la re­gi­stra­zio­ne e la ri­so­lu­zio­ne dei problemi durante lo svol­gi­men­to dei processi. In breve tempo si è però scoperto che i log del web server fornivano anche molti altri dati preziosi, come ad esempio in­for­ma­zio­ni sull’usabilità e la po­po­la­ri­tà del sito gestito sul server, com­pren­si­ve di dati utili sui vi­si­ta­to­ri, quali:

  • Orario in cui le pagine sono state visitate
  • Numero di pagine aperte
  • Durata della sessione
  • Indirizzo IP e nome host dell’utente
  • In­for­ma­zio­ni sulle richieste del client (in genere il browser)
  • Motore di ricerca e termini uti­liz­za­ti
  • Sistema operativo in uso

La sintassi di un file di log appare ge­ne­ral­men­te così:

183.121.143.32 - - [18/Mar/2003:08:04:22 +0200] "GET /images/logo.jpg HTTP/1.1" 200 512 "http://www.wikipedia.org/" "Mozilla/5.0 (X11; U; Linux i686; de-DE;rv:1.7.5)"

Di seguito una spie­ga­zio­ne dei singoli parametri:

Si­gni­fi­ca­to Valore di esempio Spie­ga­zio­ne
Indirizzo IP 183.121.143.32 Si tratta dell’indirizzo IP dell’host ri­chie­den­te
Non pervenuto - Di default il pro­to­col­lo di iden­ti­fi­ca­zio­ne RFC-1413 non è stato iden­ti­fi­ca­to
Chi? - Svela il nome utente, se è avvenuta un’au­ten­ti­ca­zio­ne HTTP; al­tri­men­ti il campo rimane vuoto come in questo caso
Quando? [18/Mar/2003:08:04:22 +0200] È indicato l’orario completo: data, ora e in­for­ma­zio­ni sul fuso orario
Cosa? GET /images/logo.jpg HTTP/1.1 Indica l’evento avvenuto, in questo caso la richiesta di un’immagine tramite HTTP
Ok 200 Segnala la conferma della richiesta ef­fet­tua­ta (codice di stato HTTP 200)
Quanto? 512 Se rilevato: quantità dei dati trasmessi in byte
Da dove? http://www.wikipedia.org/ Indica l’indirizzo web dal quale sono stati richiesti i dati
Con cosa? Mozilla/5.0 (X11; U; Linux i686; de-DE;rv:1.7.5) Fornisce in­for­ma­zio­ni tecniche sul client: browser, sistema operativo, kernel, in­ter­fac­cia utente, lingua, versione

Per ana­liz­za­re il flusso di in­for­ma­zio­ni, sono stati svi­lup­pa­ti strumenti come Webalizer o W3 Sta­ti­stics, che con­ver­to­no i dati rilevati in sta­ti­sti­che, tabelle e grafici. Così emergono ad esempio le tendenze sulla crescita del sito, l’usabilità delle singole pagine o i temi e le parole chiave rilevanti. Anche se l’analisi dei log del web server continua ad essere fatta, è stata so­sti­tui­ta per la maggior parte da nuovi metodi di analisi web come i cookies o i tag. Ciò è causato in parte dal rischio elevato di com­met­te­re errori nell’as­se­gna­zio­ne delle sessioni durante l’analisi dei log e in parte dal fatto che i webmaster di un sito non hanno spesso accesso ai log del web server, dove sono però re­gi­stra­ti tutti i messaggi di errore. Inoltre i dati, ri­ca­va­bi­li tramite un’analisi dei log, sono con­ser­va­ti di­ret­ta­men­te dall’azienda.

Vai al menu prin­ci­pa­le