Essendo un sistema di apprendimento autonomo, RankBrain ricorre così alla sua esperienza con le richieste poste in precedenza, crea collegamenti e mostra delle previsioni su quello che cerca l’utente e trova il modo per rispondere al meglio alla sua richiesta. Così scioglie le ambiguità e rende accessibile il significato di termini sconosciuti fino ad ora (ad esempio di neologismi).
Google non rivela però come il sistema di IA sia in grado di svolgere questo compito. Gli esperti SEO presumono però che RankBrain trasmetta le ricerche tramite vettori di parole in una forma tale che consenta ai computer di interpretare le varie correlazioni.
Già nel 2013 Google ha rilasciato il software open source di machine learning Word2Vec, con il quale si trasmettono, si misurano e si confrontano i legami semantici tra le parole in una rappresentazione matematica. Alla base di questa analisi ci sono i corpora linguistici.
Per “apprendere” le relazioni tra le parole, Word2Vec genera prima di tutto uno spazio vettoriale n-dimensionale, in cui ogni parola del corpus alla base è rappresentata come vettore (si parla di “dati di test”). Così n indica in quante dimensioni vettoriali deve essere riprodotta una parola. Più dimensioni vengono scelte per i vettori delle parole, più il programma comprende le relazioni con le altre parole.
Nel secondo passaggio lo spazio vettoriale creato viene immesso in una rete neurale artificiale (in inglese artificial neural network, abbreviato in ANN) che consente di adattarlo tramite un algoritmo di apprendimento di modo tale che le parole, usate nello stesso contesto, creino anche un vettore di parole simile. La somiglianza tra i vettori di parole viene calcolata servendosi della cosiddetta similarità del coseno con valori compresi tra -1 e +1.
Detto in altre parole: se si immette su Word2Vec come input un qualsiasi corpus, il programma restituisce come output dei vettori di parola corrispondenti, che consentono una valutazione della vicinanza o distanza semantica delle parole contenute nel corpus. Se Word2Vec viene confrontato con un nuovo input, il programma è in grado di adattare lo spazio vettoriale e di creare così nuove relazioni di significato o di tralasciare i vecchi presupposti, grazie all’algoritmo di apprendimento: la rete neurale viene quindi “allenata”.