Come funziona l’analisi dei file di log con GoAccess

I file di log del vostro server vi rivelano tutto sul comportamento dei vostri visitatori. In questo modo, tramite un’analisi del file di log, potete per esempio scoprire quali browser utilizzano i vostri utenti, quanto tempo si soffermano sul vostro sito e quante pagine visualizzano o tramite quali motori di ricerca, nonché link, sono giunti sulla vostra pagina. Grazie a queste informazioni, il file di log è un’importantissima fonte per il monitoraggio dell’usabilità e dell’ottimizzazione del vostro sito. Poiché risulta impossibile analizzare queste enormi quantità di dati, ci sono diversi strumenti di analisi dei file di log (i cosiddetti analizzatori di log) che svolgono questi compiti e vi forniscono dei risultati dettagliati, presentati insieme a dei grafici. Un tipico analizzatore di questo tipo è lo strumento open source GoAccess.

Cosa c’è da sapere su GoAccess

Nel luglio 2010 lo sviluppatore Gerardo Orellana rilasciò la prima versione di questo tool di analisi, continuando tuttora a curarne lo sviluppo sulla piattaforma GitHub. GoAccess può essere utilizzato dal 2016 in modo gratuito come software libero (con licenza GNU) e può essere adattato alle proprie esigenze.

L’idea alla base di GoAccess è l’analisi e la visualizzazione di statistiche web in tempo reale. Per garantirle, lo strumento di analisi analizza i più diversi formati di log di server web e servizi di cloud come Apache, nginx, Amazon S3 o CloudFront e visualizza i risultati graficamente su una dashboard. È possibile visualizzare GoAccess nei sistemi Unix, sul browser o tramite la riga di comando. In alternativa le statistiche possono anche essere salvate in formato HTML, JSON o CSV.

GoAccess richiede solo i requisiti di sistema minimi e presuppone solo la libreria C ncurses, essendo scritto nel linguaggio di programmazione C. Per utilizzare l’analizzatore di log su un sistema operativo Windows, utilizzate lo strumento di raccolta Cygwin, grazie al quale potete avviare determinate applicazioni Linux anche su un sistema Microsoft.

Le funzionalità principali di GoAccess

Per cominciare a utilizzare GoAccess non è necessario alcun tipo di configurazione. Selezionate i file di log da analizzare, cominciate la verifica e otterrete così le informazioni in tempo reale. I dati sono riportati suddivisi per diversi ambiti, anche se vengono rappresentati sia i valori per i singoli periodi di misurazione sia il valore per l’intero periodo preso in esame. Questi elenchi vengono ordinati in modo cronologico, ma potete anche classificarli in base al numero di visualizzazioni o utenti, della banda larga utilizzata o del tempo impiegato per caricare il sito (valori complessivi, in media o massimi). Alcuni valori sono anche visualizzabili in grafici a barre o a linee. Oltre alle informazioni attuali, alla voce “Overall Analyzed Requests”, GoAccess vi offre una sintesi di tutti i file di log analizzati finora.

Sia la dashboard del programma sia quella del browser (entrambi in inglese) presentano una visualizzazione comoda e user-friendly dei grafici e delle colonne, in modo tale da ricavare considerazioni importanti sugli utenti e sul sito in tempi molto brevi. La seguente tabella mostra i diversi ambiti analizzati dal strumento di analisi dei log e riassume i dati ricavati dai valori.

Sezione Traduzione Valori determinanti Importanza per l’analisi web
Unique visitors per day – including spiders Visitatori singoli al giorno, inclusi i crawler Visualizzazioni, visitatori, data (Dati ricavati) Con visitatore unico sono intese le visualizzazioni effettuate dallo stesso indirizzo IP. Monitorando il numero di visitatori per un periodo di tempo più lungo, potete capire se le campagne o i nuovi contenuti hanno avuto successo.
Requested Files (URLs) File o URL richiesti Visualizzazioni, banda larga, tempi di caricamento (Avg., Cum., Max. T.S.), URL (Dati ricavati) In questa sezione vengono visualizzati gli URL richiesti più frequentemente. In questo modo scoprite quali sono le pagine più popolari del vostro sito, quanta banda viene utilizzata e quanto sono stabili i tempi di caricamento delle pagine.
Static Requests Richieste statiche Visualizzazioni, banda larga, tempi di caricamento, file (Dati ricavati) Come nel caso precedente si tratta di file richiesti, tuttavia sono presi in considerazione solo contenuti statici come immagini, icone o elementi di layout.
Not Found URLs (404s) URL non trovati (errori 404) Visualizzazioni, URL (Dati ricavati) Gli URL elencati in questa sezione hanno portato i visitatori a un errore 404. Grazie a questa statistica potete riconoscere e risolvere problemi legati alla rete o a link difettosi. Questi ultimi vengono valutati negativamente sia dagli utenti sia dai motori di ricerca.
Visitor Hostnames and IPs Nome host e IP dei visitatori Città, Paese, nome host, IP (Dati ricavati) In questa rubrica ricevete informazioni sul provider e sull’indirizzo IP dei vostri visitatori. GoAccess trasmette dati sul paese di origine e sul luogo. L’uso consiste nell’offrire agli utenti contenuti personalizzati. Tuttavia sia indirizzi IP completi sia la geolocalizzazione non sono conformi alla legge italiana in materia di privacy. (Presuppone inoltre il localizzatore GeoIP della Maxmind.)
Operating Systems Sistemi operativi Visualizzazioni, visitatori, sistema operativo (Dati ricavati) In questa rubrica potete visualizzare quali sistemi operativi utilizzano i vostri utenti, ordinati per frequenza. Con l’aiuto di questi dati potete per esempio visualizzare il volume del traffico mobile.
Browsers Browser Visualizzazioni, visitatori, browser(Dati ricavati) In questa sezione vengono presentati i tipi di client dai quali viene effettuato l’accesso. In primo luogo visualizzate i dati dei diversi browser, ma anche se e quali crawler scansionano il vostro sito.
Time Distribution Distribuzione temporale delle visualizzazioni Visualizzazioni, visitatori, tempi di caricamento, ora (Dati ricavati) Ricevete un’analisi precisa su base oraria sui dati di accesso. In questo modo potete visualizzare esattamente quando i vostri utenti sono particolarmente attivi e, quindi, quando è il momento migliore per pubblicare nuovi contenuti.
Virtual Hosts Host virtuali Visualizzazioni, banda larga, host (Dati ricavati) Se gestite più host virtuali (domini, indirizzi IP) sul vostro server, con l’aiuto di questa statistica potete capire quale tra questi utilizza maggiormente le risorse del vostro server.
Referrers URLs URL di destinazione Visualizzazioni, URL (Dati ricavati) Il referrer è l’informazione sull‘URL che appare nel file di log, tramite il quale i visitatori giungono sulla vostra pagina. Con questa statistica potete da una parte filtrare le pagine dei vostri partner, dall’altra potete anche scoprire le parole chiave utilizzate dagli utenti, nel caso in cui siano giunti al vostro sito da un motore di ricerca.
Referring Sites Siti web di riferimento Visualizzazioni, indirizzi web (Dati ricavati) Rispetto alla statistica precedente qui non ricevete l’URL, bensì l’indirizzo web generico della pagina di provenienza.
Keyphrases from Google’s search engine Parole chiave utilizzate nel motore di ricerca di Google Visualizzazioni, parole chiave (Dati ricavati) Oltre alle statistiche “Referrer”, GoAccess offre una lista separata dei criteri di ricerca, almeno per Google. Questo vi risparmia la fatica di analizzare autonomamente gli URL. I risultati qui presentati possono fornire un utile input per la vostra strategia di parole chiave.
Geo Location Geotargeting Visitatori, provenienza (Dati ricavati) Alla voce “Geo location” trovate un’esatta assegnazione degli indirizzi IP per la localizzazione geografica del sistema utilizzato dall’utente. I dati presentano lo stesso problema legato alla privacy come la statistica relativa al nome host e all’IP dell’utente. (Richiede inoltre GeoIP della Maximd.)
HTTP Status Codes Codici di stato HTTP Visualizzazioni, codice di stato (Dati ricavati) Questa sezione fornisce una panoramica sulle risposte del vostro server. Potete ricavare i dati se il vostro server web funziona regolarmente e se è possibile visualizzare tutti i contenuti privi di errori.

Come installare e utilizzare GoAccess

Per essere sicuri di installare la versione più recente di GoAccess, dovreste scaricare il file di installazione dalla pagina ufficiale. L’installazione avviene nel modo seguente tramite la riga di comando:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

Non dimenticate che possedere ncurses è un requisito fondamentale per la funzionalità dell’analizzatore di log per web server basato su Apache o Nginx e dovrebbe essere installato sul vostro sistema anche nella versione più recente. Se non l’avete già fatto, potete configurare la libreria standard di C con il seguente codice:

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Una panoramica dettagliata in lingua inglese sulle opzioni di configurazione dello strumento di analisi dei log, potete trovarla su questo link.


Offerta Black Friday
Non perderti la nostra offerta speciale sui prodotti pensati per il tuo successo online. Approfittane subito, hai tempo solo fino al 30 novembre.
Sconti fino al 98%