Nel 2014 i ri­cer­ca­to­ri della Princeton Uni­ver­si­ty e della KU Leuven Uni­ver­si­ty hanno pub­bli­ca­to uno studio dal titolo “The web never forgets: Per­si­stent tracking me­cha­ni­sms in the wild” sui moderni metodi di trac­cia­men­to degli utenti. Oltre agli ever­coo­kie e alla sin­cro­niz­za­zio­ne dei cookie, si sono so­prat­tut­to fo­ca­liz­za­ti nel, fino ad allora re­la­ti­va­men­te sco­no­sciu­to, canvas fin­ger­prin­ting. In oltre il 5,5% dei 100.000 siti web più im­por­tan­ti al momento dello studio, la raffinata tecnica usava i risultati per iden­ti­fi­ca­re gli utenti.

per iden­ti­fi­ca­re gli utenti. Che cos’è il canvas fin­ger­prin­ting?

Keaton Mowery e Hovav Shacham, ri­cer­ca­to­ri nell’uni­ver­si­tà della Ca­li­for­nia, hanno formulato per la prima volta nel 2012 l’idea del trac­cia­men­to via fin­ger­prin­ting nel loro lavoro “Pixel Perfect: Fin­ger­prin­ting Canvas in HTML5”. Nella pub­bli­ca­zio­ne sono esposte le loro con­si­de­ra­zio­ni sul fatto che, con l’aiuto degli elementi canvas in­tro­dot­ti nell’HTML5, può essere generata senza problemi un’impronta digitale in­di­vi­dua­le sulla base della con­fi­gu­ra­zio­ne di sistema dell’utente web. Il pro­gram­ma­to­re russo Valentin Vasilyev, ispirato dal lavoro di entrambi i ri­cer­ca­to­ri, ha svi­lup­pa­to e ri­la­scia­to un anno dopo il primo codice canvas fin­ger­prin­ting sotto licenza open source su GitHub. Il suo codice è servito ad aziende, come AddThis e Ligatus, come base per rea­liz­za­re il tracking.

Negli elementi canvas citati ci sono campi ben de­fi­ni­bi­li (altezza e larghezza), che possono essere spe­ci­fi­ca­ti con Ja­va­Script, per creare ad esempio grafici, loghi e pulsanti, inclusivi di testo. Tuttavia, usando il canvas fin­ger­prin­ting, la pre­sen­ta­zio­ne del testo avviene in maniera diversa a seconda:

  • del sistema operativo
  • del browser
  • della scheda grafica
  • dei driver della scheda grafica
  • dei font del client in­stal­la­ti.

Il gestore del sito web ha bisogno per questo scopo solo di un codice canvas fin­ger­prin­ting specifico, che induce il browser nell’apertura della pagina a vi­sua­liz­za­re in back­ground un testo nascosto via Ja­va­Script e, per mezzo di ciò, inoltrare le in­for­ma­zio­ni ottenute al server web. Grazie al grande numero di fattori presi in con­si­de­ra­zio­ne, l’impronta digitale creata in questo modo è unica in oltre l’80% dei casi, per cui può essere ri­co­no­sciu­ta in qualunque momento, a patto che l’utente non apporti alcuna modifica a uno dei sistemi di con­fi­gu­ra­zio­ne sopra elencati.

Il valore del canvas fin­ger­prin­ting per l’analisi web

Il canvas fin­ger­prin­ting ottiene di fatto solo le in­for­ma­zio­ni già citate dal sistema e dal browser. Ma queste offrono già la pos­si­bi­li­tà di iden­ti­fi­ca­re il vi­si­ta­to­re di un sito web come singolo individuo, per de­ter­mi­na­re infine il suo com­por­ta­men­to di na­vi­ga­zio­ne. Può trattarsi in con­tem­po­ra­nea delle attività di uno o più siti web, se lo script è im­ple­men­ta­to su diverse pagine. Di con­se­guen­za il metodo è molto in­te­res­san­te sia nell’ot­ti­miz­za­zio­ne del sito web che anche nell’ideazione della pub­bli­ci­tà mirata ad uno specifico target. Uno dei vantaggi maggiori del moderno metodo di trac­cia­men­to degli utenti è che non raccoglie alcun dato personale. Per gli analisti web questo rende il canvas fin­ger­prin­ting un’al­ter­na­ti­va da prendere se­ria­men­te in con­si­de­ra­zio­ne rispetto ai cookie, che creano sempre problemi a livello legale e vengono bloccati ed eliminati da molti utenti.

Dal momento che l’impronta digitale non è unica al 100% al contrario di quella reale, i risultati del canvas fin­ger­prin­ting non sono sempre com­ple­ta­men­te af­fi­da­bi­li. Così, due vi­si­ta­to­ri di un sito web con, ad esempio, le stesse con­fi­gu­ra­zio­ni ottengono solo un ID utente, aspetto che altera le ulteriori ricerche. Poiché la pro­ba­bi­li­tà di una cor­ri­spon­den­za di questo tipo cresce a seconda del numero degli utenti tracciati, questa pro­ble­ma­ti­ca aumenta insieme al traffico del sito web ana­liz­za­to. Un ulteriore problema del fin­ger­prin­ting canvas emerge durante l’iden­ti­fi­ca­zio­ne degli utenti che uti­liz­za­no i di­spo­si­ti­vi mobili: gli hardware e i software dei tablet e degli smarphone sono di regola standard, ragion per cui sus­si­sto­no pochi segni di­stin­ti­vi per creare un’impronta digitale unica.

Come gli utenti possono aggirare il canvas fin­ger­prin­ting

Al contrario dei cookie, il canvas fin­ger­prin­ting non può essere eliminato fa­cil­men­te, perché i dati vengono di­ret­ta­men­te trasmessi al server, quindi non avviene una me­mo­riz­za­zio­ne lato client. Allo stesso modo, anche la modalità in incognito di un browser non impedisce agli script canvas di spiare le in­for­ma­zio­ni del sistema e del browser. Ma gli utenti non sono com­ple­ta­men­te indifesi contro questo metodo di tracking e possono impedire pre­ven­ti­va­men­te l’ese­cu­zio­ne di script simili, ad esempio mettendo in atto le seguenti misure: 

  • Di­sat­ti­va­re Ja­va­Script: senza Ja­va­Script gli elementi canvas non possono essere caricati e quindi non si può ri­chia­ma­re nemmeno alcuna in­for­ma­zio­ne tramite il client. Ma, dal momento che molti siti web con­ten­go­no Ja­va­Script, può capitare che questi non vengano più vi­sua­liz­za­ti in maniera corretta dopo la di­sat­ti­va­zio­ne di Ja­va­Script.

  • Adblock Plus: Adblock Plus è so­prat­tut­to un’esten­sio­ne del browser co­no­sciu­ta per bloccare la pub­bli­ci­tà e insieme a Fil­ter­li­ste Ea­sy­Pri­va­cy, il plug-in blocca anche il trac­cia­men­to fin­ger­prin­ting.

  • Can­va­sBloc­ker: gli utenti di Firefox ottengono con il com­po­nen­te ag­giun­ti­vo Can­va­sBloc­ker diverse opzioni per bloccare il canvas fin­ger­prin­ting. Ad esempio, è possibile ignorare tutte le richieste canvas o ma­ni­po­la­re i dati recenti in modo che il fin­ger­prin­ting ottenga sempre un altro valore.

Tra­spa­ren­za come pre­sup­po­sto fon­da­men­ta­le

Quando nel 2014 apparve la lista dei siti web che facevano uso del canvas fin­ger­prin­ting, molti gestori di siti web si stupirono di trovarsi tra gli oltre 5000 casi, perché non avevano im­ple­men­ta­to loro stessi il processo di tracking ma si erano affidati, ad esempio, ad agenzie di per­for­man­ce marketing, come la tedesca Ligatus. Ma, stando a quanto sostenuto dall’agenzia, si trattava solo di una fase di test tem­po­ra­nea, nella quale furono raccolte esclu­si­va­men­te in­for­ma­zio­ni anonime senza pos­si­bi­li­tà di risalire all’utente reale. Tuttavia, la maggior parte dei siti web usa, allo stesso modo senza saperlo, il code tracking dell’azienda sta­tu­ni­ten­se AddThis, che è co­no­sciu­ta so­prat­tut­to at­tra­ver­so i pulsanti social media sui siti web.

Vai al menu prin­ci­pa­le