Il 25 gennaio 2021, Google ha pre­sen­ta­to in maniera ap­pro­fon­di­ta la visione dell’azienda di un futuro web senza cookie, ma pieno di pub­bli­ci­tà. Nel post del blog “Building a privacy-first future for web ad­ver­ti­sing” il gigante dei motori di ricerca ha delineato per la prima volta in dettaglio come fun­zio­ne­rà l’at­ti­va­zio­ne della pub­bli­ci­tà per­so­na­liz­za­ta se i cookie di terze parti non saranno più sup­por­ta­ti. Una parte ele­men­ta­re prevista del progetto Privacy Sandbox è il metodo del co­sid­det­to Federated Learning of Cohorts (FLoC), in italiano “Ap­pren­di­men­to federato delle coorti”.

Vi sveliamo cosa si nasconde dietro il concetto di FLoC e come dovrebbe fun­zio­na­re esat­ta­men­te l’al­ter­na­ti­va ri­spet­to­sa della privacy per la ge­ne­ra­zio­ne e l’utilizzo di profili utente in­di­vi­dua­li.

Che cos’è FLoC (Federated Learning of Cohorts)?

Il 14 gennaio 2020, Google ha reso nota pub­bli­ca­men­te la sua in­ten­zio­ne di ag­giun­ge­re un’API chiamata Federated Learning of Cohorts (FLoC) al proprio browser Chrome. Grazie a questa in­ter­fac­cia, gli utenti do­vreb­be­ro ricevere pub­bli­ci­tà basata sui propri interessi senza che il browser faccia af­fi­da­men­to sui cookie per il trac­cia­men­to, evitando di in­ter­fe­ri­re così in modo cruciale con la propria privacy. A tal fine, l’API FLoC si basa su un algoritmo che assegna gli utenti del browser a diverse coorti. I membri di una coorte, che in questo caso possono anche essere indicati come gruppi di interesse, mostrano un com­por­ta­men­to di na­vi­ga­zio­ne simile. Il ri­spet­ti­vo iden­ti­fi­ca­ti­vo della coorte (in inglese “cohort id”) ha quindi lo scopo di per­met­te­re a Google e ai partner pub­bli­ci­ta­ri di mostrare in seguito la pub­bli­ci­tà per­ti­nen­te in modo ri­spet­to­so della privacy e conforme sia al re­go­la­men­to ePrivacy che al nuovo GDPR.

N.B.

Le coorti non sono uno strumento di analisi web nuovo: spe­cial­men­te nell’e-commerce, l’analisi delle coorti è stata richiesta per anni come mezzo per com­pren­de­re ra­pi­da­men­te il com­por­ta­men­to degli utenti.

Perché FLoC è ne­ces­sa­rio come nuovo metodo per la pub­bli­ci­tà per­so­na­liz­za­ta?

Gli annunci pub­bli­ci­ta­ri sono un mezzo in­di­spen­sa­bi­le per molte aziende per generare traffico per il proprio progetto web e per molti editori un modo al­tret­tan­to in­di­spen­sa­bi­le per gua­da­gna­re. Gli utenti, d’altra parte, pre­fe­ri­sco­no gli annunci rilevanti e utili per loro. I cookie o il browser fin­ger­prin­ting sono stati finora i metodi più semplici e mirati per creare i profili utente necessari. Tuttavia, sono criticati da anni (a ragione) a causa della loro in­tru­sio­ne nella privacy degli utenti del browser. FLoC promette un approccio al­ter­na­ti­vo che potrebbe sod­di­sfa­re gli in­ser­zio­ni­sti, gli editori e gli utenti, pre­ser­van­do anche la relativa privacy.

Come funziona l’ap­pren­di­men­to federato delle coorti?

L’algoritmo, il com­po­nen­te ele­men­ta­re della tec­no­lo­gia FLoC, è ancora a uno stadio spe­ri­men­ta­le. Il suo fun­zio­na­men­to si può de­scri­ve­re come segue: sulla base della cro­no­lo­gia del browser, verrebbe assegnato un ID di coorte a un utente che sia rap­pre­sen­ta­ti­vo dei suoi interessi. Per evitare che l’utente sia ri­co­no­sciu­to sulla base di questo ID, deve con­di­vi­der­lo con almeno un certo numero di utenti di Chrome (un numero concreto non è però ancora di­spo­ni­bi­le). Sulla base dell’ID, gli editori e gli in­ser­zio­ni­sti possono quindi desumere i ri­spet­ti­vi interessi e attivare annunci adeguati, ecc.

Inoltre, Google basa lo sviluppo e l’ela­bo­ra­zio­ne dell’algoritmo sui seguenti principi:

  1. L’ID della coorte ha lo scopo di impedire il trac­cia­men­to cross-site, cioè la raccolta dei dati dai siti web sul com­por­ta­men­to dell’utente.
  2. Una coorte ha lo scopo di rag­grup­pa­re gli utenti con un com­por­ta­men­to di na­vi­ga­zio­ne simile.
  3. L’algoritmo deve basarsi sull’un­su­per­vi­sed learning (ap­pren­di­men­to non su­per­vi­sio­na­to), cioè deve essere capace di “imparare da solo” senza un in­ter­ven­to esterno.
  4. L’algoritmo dovrebbe ridurre al minimo l’uso di “numeri magici”, vale a dire che dovrebbe con­trad­di­stin­guer­si per una scelta dei parametri la più semplice e chiara possibile.
  5. Il calcolo di una coorte FLoC dovrebbe essere il più semplice possibile e ri­chie­de­re poca capacità di calcolo.

I principi as­si­cu­ra­no che la ge­ne­ra­zio­ne e la gestione delle parti in­te­res­sa­te siano tra­spa­ren­ti e facili da capire e non possano essere in­fluen­za­ti dall’esterno. Inoltre, hanno lo scopo di garantire la migliore pro­te­zio­ne dei dati possibile, poiché secondo il principio FLoC gli utenti sono ano­ni­miz­za­ti all’interno delle loro coorti e vengono raccolti e valutati solo i loro dati.

Il fun­zio­na­men­to di FLoC il­lu­stra­to con un esempio

Il modo migliore per il­lu­stra­re esat­ta­men­te come funziona l’idea del metodo Federated Learning of Cohorts di Google è usare un esempio concreto. Le parti coinvolte nel nostro esempio di FLoC sono le seguenti:

  • Utente 1: utente del browser a cui è assegnata la coorte campione 123; vorrebbe comprare delle scarpe sportive online
  • Utente 2: utente del browser a cui è anche assegnata la coorte campione 123; vorrebbe ag­gior­nar­si sulle ultime notizie online
  • In­ser­zio­ni­sta: negozio di moda online che inserisce annunci per i propri prodotti su altri siti web uti­liz­zan­do piat­ta­for­me pub­bli­ci­ta­rie
  • Editore: sito di notizie ag­gior­na­to che vi­sua­liz­za gli annunci pub­bli­ci­ta­ri, compresi quelli del negozio online di moda
  • Piat­ta­for­ma pub­bli­ci­ta­ria: piat­ta­for­ma che offre strumenti e dati per la vi­sua­liz­za­zio­ne di annunci pub­bli­ci­ta­ri; funge da in­ter­me­dia­rio tra in­ser­zio­ni­sta ed editore

Primo passaggio: ge­ne­ra­zio­ne della coorte

Nella prima fase, il browser o l’algoritmo FLoC su cui il browser si basa crea diversi gruppi di interesse. A ogni coorte viene assegnato un ID unico.

Secondo passaggio: as­se­gna­zio­ne dell’ID della coorte

Sulla base della cro­no­lo­gia di na­vi­ga­zio­ne dell’utente 1, il browser determina la coorte cor­ri­spon­den­te, che in questo caso è l’ID 123. Il browser dell’utente 2 analizza anche la cro­no­lo­gia di utilizzo per assegnare l’iden­ti­fi­ca­ti­vo cor­ri­spon­den­te. Anche se la cro­no­lo­gia è leg­ger­men­te diversa da quella dell’utente 1, è ancora ab­ba­stan­za simile e perciò all’utente 2 viene assegnato ugual­men­te l’ID FLoC 123.

Terzo passaggio: visita del negozio online (in­ser­zio­ni­sta)

L’utente 1 inizia la sua ricerca sul web di scarpe sportive. Si imbatte nel negozio online dell’in­ser­zio­ni­sta e sfoglia la col­le­zio­ne di scarpe sportive e articoli correlati che gli vengono proposti. Durante questa visita, l’in­ser­zio­ni­sta riceve l’ID della coorte dell’utente 1 e condivide le co­no­scen­ze acquisite sul com­por­ta­men­to d’uso dei membri della coorte 123 con la piat­ta­for­ma pub­bli­ci­ta­ria con cui collabora per inserire gli annunci.

Quarto passaggio: visita della pagina delle notizie (editore)

L’utente 2, alla ricerca delle ultime notizie, arriva sulla pagina di news del nostro editore preso ad esempio e gli fornisce il suo ID di coorte durante il processo. Per far vi­sua­liz­za­re all’utente 2 annunci per­so­na­liz­za­ti, l’editore si rivolge alla piat­ta­for­ma pub­bli­ci­ta­ria con la quale collabora anche il gestore del negozio online. Come parte della richiesta, viene trasmesso anche l’ID di FLoC 123.

Quinto passaggio: de­ter­mi­na­zio­ne della pub­bli­ci­tà per­so­na­liz­za­ta ap­pro­pria­ta (piat­ta­for­ma pub­bli­ci­ta­ria)

Il fornitore della rete pub­bli­ci­ta­ria può ora de­ter­mi­na­re l’annuncio ap­pro­pria­to per l’utente 2, per il quale ha i seguenti dati grazie all’ap­pren­di­men­to federato delle coorti:

  • L’ID di coorte dell’utente 2 (123), trasmesso dall’editore
  • i propri dati sugli interessi degli utenti del browser della coorte 123
  • i dati trasmessi dall’in­ser­zio­ni­sta (negozio online) sugli interessi dei prodotti (scarpe da corsa) degli utenti della coorte 123

La piat­ta­for­ma pub­bli­ci­ta­ria inserisce un annuncio per le scarpe da corsa nel negozio online di esempio, poiché è un risultato di vi­sua­liz­za­zio­ne adatto per l’utente 2, che viene pre­sen­ta­to im­me­dia­ta­men­te sulla pagina delle notizie, com­ple­ta­men­te senza l’uso di cookie.

FLoC e pro­te­zio­ne dei dati: una simbiosi perfetta?

A prima vista, l’ap­pren­di­men­to federato delle coorti sembra essere la soluzione perfetta per dividere gli utenti del browser in gruppi di interesse senza in­ter­fe­ri­re troppo con la loro privacy. Almeno per il mercato americano, Google sembra non avere dubbi su questa ipotesi: i pre­pa­ra­ti­vi per la piena im­ple­men­ta­zio­ne di FLoC in Chrome sono in pieno svol­gi­men­to negli Stati Uniti. Già nel secondo trimestre del 2021, i primi annunci nella rete pub­bli­ci­ta­ria di Google Ads saranno eseguiti sulla base della tec­no­lo­gia FLoC.

Nel frattempo, in Europa, Google ha sospeso i test di Federated Learning of Cohorts. Il prin­ci­pa­le punto critico è dato dal fatto che non risulta chiaro al momento della creazione delle coorti chi sia il re­spon­sa­bi­le dei dati e chi si occupi della loro ela­bo­ra­zio­ne. Ana­liz­zan­do la si­tua­zio­ne giuridica europea sulla pro­te­zio­ne dei dati e la privacy, emergono anche altri punti con­tro­ver­si: l’ID di coorte assegnato che collega gli utenti a un gruppo di interesse, così come tutte le in­for­ma­zio­ni correlate, po­treb­be­ro essere po­ten­zial­men­te con­si­de­ra­ti “dati personali”. Inoltre, il trat­ta­men­to dei dati raccolti e uti­liz­za­ti per generare le coorti potrebbe anche violare le regole del GDPR|, a meno che Google non ottenga il consenso esplicito degli utenti.

Tuttavia, nel suo ruolo di product manager di Google per il progetto Privacy Sandbox, Marshall Vale si è lasciato sfuggire quanto segue nel marzo 2021:

Citazione

It’s the start. We are working to begin testing in Europe as soon as possible. We are 100% committed to the Privacy Sandbox in Europe.” – Marshall Vale, Marzo 2021, fonte: https://twitter.com/mar­shall­va­le/status/1374494962646020098

Tra­du­zio­ne: È un inizio. Stiamo lavorando per poter iniziare il prima possibile i test in Europa. Siamo impegnati al 100 % per lanciare Privacy Sandbox in Europa. (Tradotto da IONOS)

I re­spon­sa­bi­li del progetto di Google sono quindi fiduciosi che si potranno iniziare presto i test di FLoC anche in Europa.

Gli am­mi­ni­stra­to­ri dei siti web hanno la pos­si­bi­li­tà di bloccare FLoC?

Se siete am­mi­ni­stra­to­ri di siti web avrete la pos­si­bi­li­tà di re­gi­strar­vi o di­si­scri­ver­vi al progetto Federated Learning of Cohorts. Spetterà a voi decidere se la visita al ri­spet­ti­vo sito web o negozio online deve seguire il metodo delle coorti FLoC o meno. Un punto im­por­tan­te, so­prat­tut­to per le pagine web con argomenti sensibili. Inoltre, Google vuole includere un’istanza centrale di pro­te­zio­ne che cancella au­to­ma­ti­ca­men­te certe coorti se hanno un numero elevato di utenti che visitano siti web in categorie sensibili. Il gigante dei motori di ricerca annovera tra le categorie sensibili le tematiche ri­guar­dan­ti le dif­fi­col­tà fi­nan­zia­rie o la salute mentale.

Decidete di non adottare FLoC ag­giun­gen­do la seguente voce nella Per­mis­sions Policy dell’header:

interest-cohort=()

Se avete bloccato la tec­no­lo­gia FLoC in questo modo e volete attivarla di nuovo in un secondo momento, vi basterà rimuovere sem­pli­ce­men­te la voce nell’header.

N.B.

Nei pre­ce­den­ti test di FLoC in Chrome, i siti web che non hanno indicato chia­ra­men­te di non volere uti­liz­za­re questo metodo sono stati au­to­ma­ti­ca­men­te inclusi nel calcolo della coorte se Chrome rilevava che si trattava di siti web con annunci o risorse legate alla pub­bli­ci­tà.

Vai al menu prin­ci­pa­le