I file di log del vostro server vi rivelano tutto sul com­por­ta­men­to dei vostri vi­si­ta­to­ri. In questo modo, tramite un’analisi del file di log, potete per esempio scoprire quali browser uti­liz­za­no i vostri utenti, quanto tempo si sof­fer­ma­no sul vostro sito e quante pagine vi­sua­liz­za­no o tramite quali motori di ricerca, nonché link, sono giunti sulla vostra pagina. Grazie a queste in­for­ma­zio­ni, il file di log è un’im­por­tan­tis­si­ma fonte per il mo­ni­to­rag­gio dell’usabilità e dell’ot­ti­miz­za­zio­ne del vostro sito. Poiché risulta im­pos­si­bi­le ana­liz­za­re queste enormi quantità di dati, ci sono diversi strumenti di analisi dei file di log (i co­sid­det­ti ana­liz­za­to­ri di log) che svolgono questi compiti e vi for­ni­sco­no dei risultati det­ta­glia­ti, pre­sen­ta­ti insieme a dei grafici. Un tipico ana­liz­za­to­re di questo tipo è lo strumento open source GoAccess.

Cosa c’è da sapere su GoAccess

Nel luglio 2010 lo svi­lup­pa­to­re Gerardo Orellana rilasciò la prima versione di questo tool di analisi, con­ti­nuan­do tuttora a curarne lo sviluppo sulla piat­ta­for­ma GitHub. GoAccess può essere uti­liz­za­to dal 2016 in modo gratuito come software libero (con licenza GNU) e può essere adattato alle proprie esigenze. L’idea alla base di GoAccess è l’analisi e la vi­sua­liz­za­zio­ne di sta­ti­sti­che web in tempo reale. Per ga­ran­tir­le, lo strumento di analisi analizza i più diversi formati di log di server web e servizi di cloud come Apache, nginx, Amazon S3 o Clou­d­Front e vi­sua­liz­za i risultati gra­fi­ca­men­te su una dashboard. È possibile vi­sua­liz­za­re GoAccess nei sistemi Unix, sul browser o tramite la riga di comando. In al­ter­na­ti­va le sta­ti­sti­che possono anche essere salvate in formato HTML, JSON o CSV. GoAccess richiede solo i requisiti di sistema minimi e pre­sup­po­ne solo la libreria C ncurses, essendo scritto nel lin­guag­gio di pro­gram­ma­zio­ne C. Per uti­liz­za­re l’ana­liz­za­to­re di log su un sistema operativo Windows, uti­liz­za­te lo strumento di raccolta Cygwin, grazie al quale potete avviare de­ter­mi­na­te ap­pli­ca­zio­ni Linux anche su un sistema Microsoft.

Le fun­zio­na­li­tà prin­ci­pa­li di GoAccess

Per co­min­cia­re a uti­liz­za­re GoAccess non è ne­ces­sa­rio alcun tipo di con­fi­gu­ra­zio­ne. Se­le­zio­na­te i file di log da ana­liz­za­re, co­min­cia­te la verifica e otterrete così le in­for­ma­zio­ni in tempo reale. I dati sono riportati suddivisi per diversi ambiti, anche se vengono rap­pre­sen­ta­ti sia i valori per i singoli periodi di mi­su­ra­zio­ne sia il valore per l’intero periodo preso in esame. Questi elenchi vengono ordinati in modo cro­no­lo­gi­co, ma potete anche clas­si­fi­car­li in base al numero di vi­sua­liz­za­zio­ni o utenti, della banda larga uti­liz­za­ta o del tempo impiegato per caricare il sito (valori com­ples­si­vi, in media o massimi). Alcuni valori sono anche vi­sua­liz­za­bi­li in grafici a barre o a linee. Oltre alle in­for­ma­zio­ni attuali, alla voce “Overall Analyzed Requests”, GoAccess vi offre una sintesi di tutti i file di log ana­liz­za­ti finora.

Sia la dashboard del programma sia quella del browser (entrambi in inglese) pre­sen­ta­no una vi­sua­liz­za­zio­ne comoda e user-friendly dei grafici e delle colonne, in modo tale da ricavare con­si­de­ra­zio­ni im­por­tan­ti sugli utenti e sul sito in tempi molto brevi. La seguente tabella mostra i diversi ambiti ana­liz­za­ti dal strumento di analisi dei log e riassume i dati ricavati dai valori.

Sezione Tra­du­zio­ne Valori de­ter­mi­nan­ti Im­por­tan­za per l’analisi web
Unique visitors per day – including spiders Vi­si­ta­to­ri singoli al giorno, inclusi i crawler Vi­sua­liz­za­zio­ni, vi­si­ta­to­ri, data (Dati ricavati) Con vi­si­ta­to­re unico sono intese le vi­sua­liz­za­zio­ni ef­fet­tua­te dallo stesso indirizzo IP. Mo­ni­to­ran­do il numero di vi­si­ta­to­ri per un periodo di tempo più lungo, potete capire se le campagne o i nuovi contenuti hanno avuto successo.
Requested Files (URLs) File o URL richiesti Vi­sua­liz­za­zio­ni, banda larga, tempi di ca­ri­ca­men­to (Avg., Cum., Max. T.S.), URL (Dati ricavati) In questa sezione vengono vi­sua­liz­za­ti gli URL richiesti più fre­quen­te­men­te. In questo modo scoprite quali sono le pagine più popolari del vostro sito, quanta banda viene uti­liz­za­ta e quanto sono stabili i tempi di ca­ri­ca­men­to delle pagine.
Static Requests Richieste statiche Vi­sua­liz­za­zio­ni, banda larga, tempi di ca­ri­ca­men­to, file (Dati ricavati) Come nel caso pre­ce­den­te si tratta di file richiesti, tuttavia sono presi in con­si­de­ra­zio­ne solo contenuti statici come immagini, icone o elementi di layout.
Not Found URLs (404s) URL non trovati (errori 404) Vi­sua­liz­za­zio­ni, URL (Dati ricavati) Gli URL elencati in questa sezione hanno portato i vi­si­ta­to­ri a un errore 404. Grazie a questa sta­ti­sti­ca potete ri­co­no­sce­re e risolvere problemi legati alla rete o a link difettosi. Questi ultimi vengono valutati ne­ga­ti­va­men­te sia dagli utenti sia dai motori di ricerca.
Visitor Hostnames and IPs Nome host e IP dei vi­si­ta­to­ri Città, Paese, nome host, IP (Dati ricavati) In questa rubrica ricevete in­for­ma­zio­ni sul provider e sull’indirizzo IP dei vostri vi­si­ta­to­ri. GoAccess trasmette dati sul paese di origine e sul luogo. L’uso consiste nell’offrire agli utenti contenuti per­so­na­liz­za­ti. Tuttavia sia indirizzi IP completi sia la geo­lo­ca­liz­za­zio­ne non sono conformi alla legge italiana in materia di privacy. (Pre­sup­po­ne inoltre il lo­ca­liz­za­to­re GeoIP della Maxmind.)
Operating Systems Sistemi operativi Vi­sua­liz­za­zio­ni, vi­si­ta­to­ri, sistema operativo (Dati ricavati) In questa rubrica potete vi­sua­liz­za­re quali sistemi operativi uti­liz­za­no i vostri utenti, ordinati per frequenza. Con l’aiuto di questi dati potete per esempio vi­sua­liz­za­re il volume del traffico mobile.
Browsers Browser Vi­sua­liz­za­zio­ni, vi­si­ta­to­ri, browser(Dati ricavati) In questa sezione vengono pre­sen­ta­ti i tipi di client dai quali viene ef­fet­tua­to l’accesso. In primo luogo vi­sua­liz­za­te i dati dei diversi browser, ma anche se e quali crawler scan­sio­na­no il vostro sito.
Time Di­stri­bu­tion Di­stri­bu­zio­ne temporale delle vi­sua­liz­za­zio­ni Vi­sua­liz­za­zio­ni, vi­si­ta­to­ri, tempi di ca­ri­ca­men­to, ora (Dati ricavati) Ricevete un’analisi precisa su base oraria sui dati di accesso. In questo modo potete vi­sua­liz­za­re esat­ta­men­te quando i vostri utenti sono par­ti­co­lar­men­te attivi e, quindi, quando è il momento migliore per pub­bli­ca­re nuovi contenuti.
Virtual Hosts Host virtuali Vi­sua­liz­za­zio­ni, banda larga, host (Dati ricavati) Se gestite più host virtuali (domini, indirizzi IP) sul vostro server, con l’aiuto di questa sta­ti­sti­ca potete capire quale tra questi utilizza mag­gior­men­te le risorse del vostro server.
Referrers URLs URL di de­sti­na­zio­ne Vi­sua­liz­za­zio­ni, URL (Dati ricavati) Il referrer è l’in­for­ma­zio­ne sull‘URL che appare nel file di log, tramite il quale i vi­si­ta­to­ri giungono sulla vostra pagina. Con questa sta­ti­sti­ca potete da una parte filtrare le pagine dei vostri partner, dall’altra potete anche scoprire le parole chiave uti­liz­za­te dagli utenti, nel caso in cui siano giunti al vostro sito da un motore di ricerca.
Referring Sites Siti web di ri­fe­ri­men­to Vi­sua­liz­za­zio­ni, indirizzi web (Dati ricavati) Rispetto alla sta­ti­sti­ca pre­ce­den­te qui non ricevete l’URL, bensì l’indirizzo web generico della pagina di pro­ve­nien­za.
Key­ph­ra­ses from Google’s search engine Parole chiave uti­liz­za­te nel motore di ricerca di Google Vi­sua­liz­za­zio­ni, parole chiave (Dati ricavati) Oltre alle sta­ti­sti­che “Referrer”, GoAccess offre una lista separata dei criteri di ricerca, almeno per Google. Questo vi risparmia la fatica di ana­liz­za­re au­to­no­ma­men­te gli URL. I risultati qui pre­sen­ta­ti possono fornire un utile input per la vostra strategia di parole chiave.
Geo Location Geo­tar­ge­ting Vi­si­ta­to­ri, pro­ve­nien­za (Dati ricavati) Alla voce “Geo location” trovate un’esatta as­se­gna­zio­ne degli indirizzi IP per la lo­ca­liz­za­zio­ne geo­gra­fi­ca del sistema uti­liz­za­to dall’utente. I dati pre­sen­ta­no lo stesso problema legato alla privacy come la sta­ti­sti­ca relativa al nome host e all’IP dell’utente. (Richiede inoltre GeoIP della Maximd.)
HTTP Status Codes Codici di stato HTTP Vi­sua­liz­za­zio­ni, codice di stato (Dati ricavati) Questa sezione fornisce una pa­no­ra­mi­ca sulle risposte del vostro server. Potete ricavare i dati se il vostro server web funziona re­go­lar­men­te e se è possibile vi­sua­liz­za­re tutti i contenuti privi di errori.

Come in­stal­la­re e uti­liz­za­re GoAccess

Per essere sicuri di in­stal­la­re la versione più recente di GoAccess, dovreste scaricare il file di in­stal­la­zio­ne dalla pagina ufficiale. L’in­stal­la­zio­ne avviene nel modo seguente tramite la riga di comando:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

Non di­men­ti­ca­te che possedere ncurses è un requisito fon­da­men­ta­le per la fun­zio­na­li­tà dell’ana­liz­za­to­re di log per web server basato su Apache o Nginx e dovrebbe essere in­stal­la­to sul vostro sistema anche nella versione più recente. Se non l’avete già fatto, potete con­fi­gu­ra­re la libreria standard di C con il seguente codice:

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Una pa­no­ra­mi­ca det­ta­glia­ta in lingua inglese sulle opzioni di con­fi­gu­ra­zio­ne dello strumento di analisi dei log, potete trovarla su questo link.

Vai al menu prin­ci­pa­le