RankBrain: l’evoluzione dell’algoritmo di Google
Che cos’è RankBrain e come sta cambiando la ricerca su Google? Dal 2015 Google utilizza il sistema di intelligenza artificiale autoapprendente RankBrain per interpretare le query di ricerca. Questo sistema aiuta a riconoscere l’intento delle persone anche in caso di termini nuovi o complessi, fornendo risultati pertinenti. L’algoritmo si basa sull’apprendimento automatico ed è considerato parte della strategia a lungo termine di Google nel campo dell’intelligenza artificiale, che include anche DeepMind.
- Siti web in tempo record
- Soluzioni IA per il tuo business
- Risparmio di tempo e risultati eccellenti
Che cos’è RankBrain? Una definizione
RankBrain è un sistema di intelligenza artificiale autoapprendente utilizzato dall’inizio del 2015 come parte dell’algoritmo di ricerca di Google “Hummingbird”. Il compito principale di RankBrain è l’interpretazione di parole chiave e frasi di ricerca con l’obiettivo di determinare la rispettiva intenzione dell’utente.
Secondo alcune informazioni, Google riceve giornalmente circa 8,5 miliardi di richieste attraverso la ricerca web. Per circa il 16 percento delle richieste da parte degli utenti si tratta di keyword e combinazioni di parole che non sono mai state prima d’ora ricercate su Google, tra cui rientrano termini colloquiali, neologismi o frasi di ricerca “long tail” (a coda lunga).
Quando Google parla di RankBrain come di un “sistema di intelligenza artificiale autoapprendente”, si riferisce a un tipo di intelligenza artificiale riconducibile alla cosiddetta IA debole. Si tratta di una tecnologia in grado di fornire soluzioni automatiche a problemi che in precedenza richiedevano l’intervento umano. Come la maggior parte dei sistemi di questo tipo, anche RankBrain si basa su tecniche di apprendimento automatico (machine learning).
Come funziona RankBrain?
RankBrain aiuta Google a interpretare gli input utente e a cercare così le pagine dall’indice di ricerca di Google, un database di circa 100 milioni di gigabyte, che si avvicinano il più possibile all’intenzione di ricerca dell’utente. In questo caso il sistema di intelligenza artificiale va ben oltre il semplice confronto dei termini ricercati.
Al posto di analizzare ogni singola parola indipendentemente dal resto della frase, RankBrain comprende la semantica dell’intera sequenza immessa dall’utente e individua così l’intenzione di chi cerca. Questo fa sì che si giunga in brevissimo tempo alla risposta desiderata, anche nel caso di query long tail.

Essendo un sistema di apprendimento autonomo, RankBrain ricorre alla sua esperienza con le richieste poste in precedenza, crea collegamenti e formula previsioni su quello che l’utente cerca e trova il modo per rispondere al meglio alla sua richiesta. Così scioglie le ambiguità e aiuta a comprendere il significato di termini sconosciuti fino ad ora (ad esempio di neologismi).
Google non rivela però come il sistema di IA sia in grado di svolgere questo compito. Chi si occupa di SEO presume però che RankBrain traduca le query in vettori di parole in una forma tale da consentire ai computer di interpretare le varie correlazioni.
Qual è la base delle analisi semantiche di RankBrain?
Secondo diverse dichiarazioni degli ingegneri di Google, RankBrain si basa in parte su concetti come Word2Vec e utilizza tecniche simili di spazio vettoriale per comprendere il significato delle parole. Già nel 2013 Google ha rilasciato il software open source di machine learning Word2Vec, che trasmette, misura e confronta i legami semantici tra le parole attraverso rappresentazioni matematiche. Alla base di questa analisi ci sono i corpora linguistici.
Creazione dello spazio vettoriale
Per “apprendere” le relazioni tra le parole, Word2Vec genera prima di tutto uno spazio vettoriale “n” dimensionale, in cui ogni parola del corpus alla base è rappresentata come vettore (si parla di “dati di addestramento”). Così “n” indica in quante dimensioni vettoriali deve essere riprodotta una parola. Più dimensioni vengono scelte per i vettori delle parole, più il programma comprende le relazioni con le altre parole.
Adattamento dello spazio vettoriale
Nel secondo passaggio lo spazio vettoriale creato viene immesso in una rete neurale artificiale (in inglese “artificial neural network”, abbreviato in ANN) che consente di adattarlo tramite un algoritmo di apprendimento in modo tale che le parole, usate nello stesso contesto, creino anche un vettore di parole simile. La somiglianza tra i vettori di parole viene calcolata servendosi della cosiddetta similarità del coseno, che assume valori compresi tra -1 e +1.
Il ruolo di Word2Vec
Immettendo su Word2Vec come input un qualsiasi corpus, il programma restituisce come output dei vettori di parola corrispondenti, che consentono una valutazione della vicinanza o distanza semantica delle parole contenute nel corpus. Se Word2Vec viene confrontato con un nuovo input, il programma è in grado di adattare lo spazio vettoriale e di creare così nuove relazioni di significato o di tralasciare i vecchi presupposti, grazie all’algoritmo di apprendimento: la rete neurale viene quindi “addestrata”.
Ufficialmente, Google non dichiara alcun collegamento tra il funzionamento di Word2Vec e il componente dell’algoritmo di ricerca RankBrain. Tuttavia, è plausibile supporre che il sistema di IA si basi su operazioni matematiche simili.
Chi si occupa di ricerca nel campo dell’intelligenza artificiale si serve delle reti neurali artificiali per simulare i principi dell’organizzazione e dell’elaborazione della mente umana. L’obiettivo è quello di sviluppare dei sistemi che sono in grado di trattare la risoluzione di problemi, anche in presenza di vaghezza o sfocatura, e che riescono così ad assumere anche i compiti che finora erano prerogativa degli esseri umani. Le reti neurali vengono utilizzate, ad esempio, da Google nell’ambito del riconoscimento automatico delle immagini.
RankBrain come fattore di ranking nell’ottimizzazione per i motori di ricerca (SEO)
Ancora più del fatto che i risultati della ricerca di Google nel campo dell’intelligenza artificiale vengano integrati nella ricerca web, sorprende l’estensione di questa integrazione: infatti dal 2016 Google non si limita solo a far interpretare tutte le richieste da RankBrain, ma secondo Greg Corrado (Senior Research Scientist di Google), il sistema di intelligenza artificiale di apprendimento automatico è persino integrato nell’algoritmo di Google e rappresenta il terzo fattore di ranking più importante.
Secondo Andrey Lipattsev, Search Quality Senior Strategist di Google, RankBrain è stato in passato il terzo fattore di ranking più importante nella ricerca web. Da allora, però, l’algoritmo di Google si è evoluto ed è oggi affiancato da BERT e da altre tecnologie basate sull’intelligenza artificiale.
Per chi gestisce siti web e per chi lavora nel campo della SEO, l’approccio alle strategie basate sulle parole chiave è profondamente cambiato. In quanto motore di ricerca semantico, Google è in grado di attingere a conoscenze pregresse sotto forma di concetti e relazioni, per determinare il significato dei testi e delle query di ricerca. Di conseguenza, il buon posizionamento di un sito per una determinata parola chiave dipende meno dalla presenza esplicita di quel termine, e più dalla rilevanza del contenuto rispetto al concetto che RankBrain associa a quella parola chiave. L’attenzione si sposta quindi dal termine in sé alla pertinenza contenutistica della pagina.
Grazie a RankBrain e al continuo sviluppo di BERT e di altre tecnologie, la rilevanza dei contenuti e l’intento di ricerca dell’utente diventano sempre più centrali nelle strategie di ottimizzazione per i motori di ricerca.
Questi moduli di IA completano RankBrain
RankBrain è stato introdotto nel 2015 e all’epoca è stato considerato un’importante svolta nell’interpretazione delle query di ricerca da parte di Google. Da allora, tuttavia, la tecnologia si è evoluta. Oggi RankBrain continua a essere una componente importante dell’algoritmo di Google, in particolare per l’interpretazione dei termini di ricerca e la comprensione dell’intento dell’utente. Tuttavia, non è più l’unico fattore che determina come vengono interpretate le query.
BERT come supporto per RankBrain
Dal 2019 Google ha introdotto BERT (Bidirectional Encoder Representations from Transformers), un ulteriore modello di intelligenza artificiale che affianca RankBrain nell’elaborazione delle query in linguaggio naturale. Mentre RankBrain è particolarmente utile per l’analisi semantica di keyword long tail e combinazioni di parole inedite, BERT si concentra maggiormente sulla contestualizzazione delle frasi complete e sull’interpretazione del significato delle parole nel loro contesto specifico.
MUM e altre tecnologie di IA per l’interpretazione delle query di ricerca
Oltre a RankBrain, Google si avvale oggi di altri modelli di intelligenza artificiale come BERT e MUM (Multitask Unified Model) per comprendere le query di ricerca in modo ancora più accurato. In particolare, le domande complesse o ambigue traggono vantaggio da questi sviluppi. MUM è in grado di combinare informazioni provenienti da fonti e formati diversi (ad esempio testo e immagini) e di metterle in relazione in modo coerente e significativo.
Anche se Google non ha mai rivelato esattamente come RankBrain, BERT e MUM interagiscano tra loro, una cosa è certa: la tecnologia di ricerca semantica si è evoluta in modo significativo.
I principali moduli di IA nell’algoritmo di Google sono:
- RankBrain: interpreta le query di ricerca, in particolare quelle nuove o formulate in modo insolito.
- BERT: analizza il contesto delle parole nelle query (ad esempio, la struttura della frase).
- MUM: comprende intenti di ricerca complessi e combina contenuti provenienti da formati diversi.
Per quanto riguarda l’ottimizzazione per i motori di ricerca, questo significa che la SEO tradizionale, basata solo su parole chiave e aspetti tecnici, non è più sufficiente. Oggi è fondamentale offrire contenuti di alta qualità, orientati all’utente, che tengano conto dell’intento di ricerca, del contesto e della rilevanza semantica.


