Che cos’è RankBrain e come sta cambiando la ricerca su Google? Dal 2015 Google utilizza il sistema di in­tel­li­gen­za ar­ti­fi­cia­le au­toap­pren­den­te RankBrain per in­ter­pre­ta­re le query di ricerca. Questo sistema aiuta a ri­co­no­sce­re l’intento delle persone anche in caso di termini nuovi o complessi, fornendo risultati per­ti­nen­ti. L’algoritmo si basa sull’ap­pren­di­men­to au­to­ma­ti­co ed è con­si­de­ra­to parte della strategia a lungo termine di Google nel campo dell’in­tel­li­gen­za ar­ti­fi­cia­le, che include anche DeepMind.

I software IA di IONOS
Scopri la potenza del­l'in­tel­li­gen­za ar­ti­fi­cia­le
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati ec­cel­len­ti

Che cos’è RankBrain? Una de­fi­ni­zio­ne

RankBrain è un sistema di in­tel­li­gen­za ar­ti­fi­cia­le au­toap­pren­den­te uti­liz­za­to dall’inizio del 2015 come parte dell’algoritmo di ricerca di Google “Hum­ming­bird”. Il compito prin­ci­pa­le di RankBrain è l’in­ter­pre­ta­zio­ne di parole chiave e frasi di ricerca con l’obiettivo di de­ter­mi­na­re la ri­spet­ti­va in­ten­zio­ne dell’utente.

Secondo alcune in­for­ma­zio­ni, Google riceve gior­nal­men­te circa 8,5 miliardi di richieste at­tra­ver­so la ricerca web. Per circa il 16 percento delle richieste da parte degli utenti si tratta di keyword e com­bi­na­zio­ni di parole che non sono mai state prima d’ora ricercate su Google, tra cui rientrano termini col­lo­quia­li, neo­lo­gi­smi o frasi di ricerca “long tail” (a coda lunga).

N.B.

Quando Google parla di RankBrain come di un “sistema di in­tel­li­gen­za ar­ti­fi­cia­le au­toap­pren­den­te”, si riferisce a un tipo di in­tel­li­gen­za ar­ti­fi­cia­le ri­con­du­ci­bi­le alla co­sid­det­ta IA debole. Si tratta di una tec­no­lo­gia in grado di fornire soluzioni au­to­ma­ti­che a problemi che in pre­ce­den­za ri­chie­de­va­no l’in­ter­ven­to umano. Come la maggior parte dei sistemi di questo tipo, anche RankBrain si basa su tecniche di ap­pren­di­men­to au­to­ma­ti­co (machine learning).

Come funziona RankBrain?

RankBrain aiuta Google a in­ter­pre­ta­re gli input utente e a cercare così le pagine dall’indice di ricerca di Google, un database di circa 100 milioni di gigabyte, che si av­vi­ci­na­no il più possibile all’in­ten­zio­ne di ricerca dell’utente. In questo caso il sistema di in­tel­li­gen­za ar­ti­fi­cia­le va ben oltre il semplice confronto dei termini ricercati.

Al posto di ana­liz­za­re ogni singola parola in­di­pen­den­te­men­te dal resto della frase, RankBrain comprende la semantica dell’intera sequenza immessa dall’utente e individua così l’in­ten­zio­ne di chi cerca. Questo fa sì che si giunga in bre­vis­si­mo tempo alla risposta de­si­de­ra­ta, anche nel caso di query long tail.

Immagine: Pagina dei risultati di ricerca Google per la frase “What’s the title of the consumer at the highest level of a food chain”
In cima alla catena ali­men­ta­re si trova l’apex predator (su­per­pre­da­to­re).

Essendo un sistema di ap­pren­di­men­to autonomo, RankBrain ricorre alla sua espe­rien­za con le richieste poste in pre­ce­den­za, crea col­le­ga­men­ti e formula pre­vi­sio­ni su quello che l’utente cerca e trova il modo per ri­spon­de­re al meglio alla sua richiesta. Così scioglie le ambiguità e aiuta a com­pren­de­re il si­gni­fi­ca­to di termini sco­no­sciu­ti fino ad ora (ad esempio di neo­lo­gi­smi).

Google non rivela però come il sistema di IA sia in grado di svolgere questo compito. Chi si occupa di SEO presume però che RankBrain traduca le query in vettori di parole in una forma tale da con­sen­ti­re ai computer di in­ter­pre­ta­re le varie cor­re­la­zio­ni.

Qual è la base delle analisi se­man­ti­che di RankBrain?

Secondo diverse di­chia­ra­zio­ni degli ingegneri di Google, RankBrain si basa in parte su concetti come Word2Vec e utilizza tecniche simili di spazio vet­to­ria­le per com­pren­de­re il si­gni­fi­ca­to delle parole. Già nel 2013 Google ha ri­la­scia­to il software open source di machine learning Word2Vec, che trasmette, misura e confronta i legami semantici tra le parole at­tra­ver­so rap­pre­sen­ta­zio­ni ma­te­ma­ti­che. Alla base di questa analisi ci sono i corpora lin­gui­sti­ci.

Creazione dello spazio vet­to­ria­le

Per “ap­pren­de­re” le relazioni tra le parole, Word2Vec genera prima di tutto uno spazio vet­to­ria­le “n” di­men­sio­na­le, in cui ogni parola del corpus alla base è rap­pre­sen­ta­ta come vettore (si parla di “dati di ad­de­stra­men­to”). Così “n” indica in quante di­men­sio­ni vet­to­ria­li deve essere ri­pro­dot­ta una parola. Più di­men­sio­ni vengono scelte per i vettori delle parole, più il programma comprende le relazioni con le altre parole.

Adat­ta­men­to dello spazio vet­to­ria­le

Nel secondo passaggio lo spazio vet­to­ria­le creato viene immesso in una rete neurale ar­ti­fi­cia­le (in inglese “ar­ti­fi­cial neural network”, ab­bre­via­to in ANN) che consente di adattarlo tramite un algoritmo di ap­pren­di­men­to in modo tale che le parole, usate nello stesso contesto, creino anche un vettore di parole simile. La so­mi­glian­za tra i vettori di parole viene calcolata ser­ven­do­si della co­sid­det­ta si­mi­la­ri­tà del coseno, che assume valori compresi tra -1 e +1.

Il ruolo di Word2Vec

Im­met­ten­do su Word2Vec come input un qualsiasi corpus, il programma re­sti­tui­sce come output dei vettori di parola cor­ri­spon­den­ti, che con­sen­to­no una va­lu­ta­zio­ne della vicinanza o distanza semantica delle parole contenute nel corpus. Se Word2Vec viene con­fron­ta­to con un nuovo input, il programma è in grado di adattare lo spazio vet­to­ria­le e di creare così nuove relazioni di si­gni­fi­ca­to o di tra­la­scia­re i vecchi pre­sup­po­sti, grazie all’algoritmo di ap­pren­di­men­to: la rete neurale viene quindi “ad­de­stra­ta”.

Uf­fi­cial­men­te, Google non dichiara alcun col­le­ga­men­to tra il fun­zio­na­men­to di Word2Vec e il com­po­nen­te dell’algoritmo di ricerca RankBrain. Tuttavia, è plau­si­bi­le supporre che il sistema di IA si basi su ope­ra­zio­ni ma­te­ma­ti­che simili.

Consiglio

Chi si occupa di ricerca nel campo dell’in­tel­li­gen­za ar­ti­fi­cia­le si serve delle reti neurali ar­ti­fi­cia­li per simulare i principi dell’or­ga­niz­za­zio­ne e dell’ela­bo­ra­zio­ne della mente umana. L’obiettivo è quello di svi­lup­pa­re dei sistemi che sono in grado di trattare la ri­so­lu­zio­ne di problemi, anche in presenza di vaghezza o sfocatura, e che riescono così ad assumere anche i compiti che finora erano pre­ro­ga­ti­va degli esseri umani. Le reti neurali vengono uti­liz­za­te, ad esempio, da Google nell’ambito del ri­co­no­sci­men­to au­to­ma­ti­co delle immagini.

RankBrain come fattore di ranking nell’ot­ti­miz­za­zio­ne per i motori di ricerca (SEO)

Ancora più del fatto che i risultati della ricerca di Google nel campo dell’in­tel­li­gen­za ar­ti­fi­cia­le vengano integrati nella ricerca web, sorprende l’esten­sio­ne di questa in­te­gra­zio­ne: infatti dal 2016 Google non si limita solo a far in­ter­pre­ta­re tutte le richieste da RankBrain, ma secondo Greg Corrado (Senior Research Scientist di Google), il sistema di in­tel­li­gen­za ar­ti­fi­cia­le di ap­pren­di­men­to au­to­ma­ti­co è persino integrato nell’algoritmo di Google e rap­pre­sen­ta il terzo fattore di ranking più im­por­tan­te.

N.B.

Secondo Andrey Lipattsev, Search Quality Senior Stra­te­gi­st di Google, RankBrain è stato in passato il terzo fattore di ranking più im­por­tan­te nella ricerca web. Da allora, però, l’algoritmo di Google si è evoluto ed è oggi af­fian­ca­to da BERT e da altre tec­no­lo­gie basate sull’in­tel­li­gen­za ar­ti­fi­cia­le.

Per chi gestisce siti web e per chi lavora nel campo della SEO, l’approccio alle strategie basate sulle parole chiave è pro­fon­da­men­te cambiato. In quanto motore di ricerca semantico, Google è in grado di attingere a co­no­scen­ze pregresse sotto forma di concetti e relazioni, per de­ter­mi­na­re il si­gni­fi­ca­to dei testi e delle query di ricerca. Di con­se­guen­za, il buon po­si­zio­na­men­to di un sito per una de­ter­mi­na­ta parola chiave dipende meno dalla presenza esplicita di quel termine, e più dalla rilevanza del contenuto rispetto al concetto che RankBrain associa a quella parola chiave. L’at­ten­zio­ne si sposta quindi dal termine in sé alla per­ti­nen­za con­te­nu­ti­sti­ca della pagina.

New call-to-action

Grazie a RankBrain e al continuo sviluppo di BERT e di altre tec­no­lo­gie, la rilevanza dei contenuti e l’intento di ricerca dell’utente diventano sempre più centrali nelle strategie di ot­ti­miz­za­zio­ne per i motori di ricerca.

Questi moduli di IA com­ple­ta­no RankBrain

RankBrain è stato in­tro­dot­to nel 2015 e all’epoca è stato con­si­de­ra­to un’im­por­tan­te svolta nell’in­ter­pre­ta­zio­ne delle query di ricerca da parte di Google. Da allora, tuttavia, la tec­no­lo­gia si è evoluta. Oggi RankBrain continua a essere una com­po­nen­te im­por­tan­te dell’algoritmo di Google, in par­ti­co­la­re per l’in­ter­pre­ta­zio­ne dei termini di ricerca e la com­pren­sio­ne dell’intento dell’utente. Tuttavia, non è più l’unico fattore che determina come vengono in­ter­pre­ta­te le query.

BERT come supporto per RankBrain

Dal 2019 Google ha in­tro­dot­to BERT (Bi­di­rec­tio­nal Encoder Re­pre­sen­ta­tions from Tran­sfor­mers), un ulteriore modello di in­tel­li­gen­za ar­ti­fi­cia­le che affianca RankBrain nell’ela­bo­ra­zio­ne delle query in lin­guag­gio naturale. Mentre RankBrain è par­ti­co­lar­men­te utile per l’analisi semantica di keyword long tail e com­bi­na­zio­ni di parole inedite, BERT si concentra mag­gior­men­te sulla con­te­stua­liz­za­zio­ne delle frasi complete e sull’in­ter­pre­ta­zio­ne del si­gni­fi­ca­to delle parole nel loro contesto specifico.

MUM e altre tec­no­lo­gie di IA per l’in­ter­pre­ta­zio­ne delle query di ricerca

Oltre a RankBrain, Google si avvale oggi di altri modelli di in­tel­li­gen­za ar­ti­fi­cia­le come BERT e MUM (Multitask Unified Model) per com­pren­de­re le query di ricerca in modo ancora più accurato. In par­ti­co­la­re, le domande complesse o ambigue traggono vantaggio da questi sviluppi. MUM è in grado di combinare in­for­ma­zio­ni pro­ve­nien­ti da fonti e formati diversi (ad esempio testo e immagini) e di metterle in relazione in modo coerente e si­gni­fi­ca­ti­vo.

Anche se Google non ha mai rivelato esat­ta­men­te come RankBrain, BERT e MUM in­te­ra­gi­sca­no tra loro, una cosa è certa: la tec­no­lo­gia di ricerca semantica si è evoluta in modo si­gni­fi­ca­ti­vo.

I prin­ci­pa­li moduli di IA nell’algoritmo di Google sono:

  • RankBrain: in­ter­pre­ta le query di ricerca, in par­ti­co­la­re quelle nuove o formulate in modo insolito.
  • BERT: analizza il contesto delle parole nelle query (ad esempio, la struttura della frase).
  • MUM: comprende intenti di ricerca complessi e combina contenuti pro­ve­nien­ti da formati diversi.

Per quanto riguarda l’ot­ti­miz­za­zio­ne per i motori di ricerca, questo significa che la SEO tra­di­zio­na­le, basata solo su parole chiave e aspetti tecnici, non è più suf­fi­cien­te. Oggi è fon­da­men­ta­le offrire contenuti di alta qualità, orientati all’utente, che tengano conto dell’intento di ricerca, del contesto e della rilevanza semantica.

Vai al menu prin­ci­pa­le