Si parla di cloaking (termine inglese che significa “na­scon­de­re“) quando un server mostra a un motore di ricerca un altro contenuto rispetto a quello che un sito ef­fet­ti­va­men­te ha. Il metodo black hat viene uti­liz­za­to come un espe­dien­te per mi­glio­ra­re il po­si­zio­na­men­to di un sito web. Google e altri motori di ricerca con­si­de­ra­no questo tipo di in­di­ciz­za­zio­ne come una vio­la­zio­ne delle linee guida dettate. Va però con­si­de­ra­to che nel cloaking l’intento di ma­ni­po­la­zio­ne non è sempre l’obiettivo prin­ci­pa­le.

Le origini del cloaking

Siti web i cui contenuti con­si­sto­no prin­ci­pal­men­te di grafiche, video o ani­ma­zio­ni flash, ottengono di regola nelle SERP un cattivo po­si­zio­na­men­to. Contenuti mul­ti­me­dia­li, ap­prez­za­ti da molti utenti, possono essere letti dai motori di ricerca basati su testi solo in modo generico. Questo gap è però fa­cil­men­te com­pen­sa­bi­le tramite il cloaking: invece della pagina originale viene mostrato al crawler una de­scri­zio­ne dell’immagine e del video e, quindi, viene mostrato un sito in mera forma testuale. I motori di ricerca possono elaborare fa­cil­men­te questi contenuti e in­di­ciz­za­re di con­se­guen­za l’offerta web. Tuttavia se un sito web presenta diverse versioni da far leggere ai crawler, è possibile che si tratti di un abuso

Cloaking come esca­mo­ta­ge

I gestori di siti web uti­liz­za­no sempre più metodi di cloaking per pre­sen­ta­re ai motori di ricerca contenuti che i vi­si­ta­to­ri non possono vedere. Questo tipo di “ma­ni­po­la­zio­ne” potrebbe essere spiegato ri­cor­ren­do all’esempio di un casinò online fittizio:

Per aumentare la vi­si­bi­li­tà sul World Wide Web, un casinò online consegna al crawler de­ter­mi­na­ti contenuti su giochi di società, e questo benché i vi­si­ta­to­ri possano uti­liz­za­re solo giochi d’azzardo a pagamento. Di con­se­guen­za il motore di ricerca, ingannato dalle false keyword trovate, mostrerà er­ro­nea­men­te il sito tra i risultati di chi ricerca giochi di società. Questo non è ben visto dai vi­si­ta­to­ri e riduce l’usabilità del motore di ricerca.

Per evitare questi esca­mo­ta­ge, i motori di ricerca rea­gi­sco­no in modo molto duro al cloaking. Il leader dei motori di ricerca Google possiede per questi casi un team Webspam spe­cia­liz­za­to. I gestori di siti web che uti­liz­za­no metodi non ri­co­no­sciu­ti, po­treb­be­ro fare i conti con la rimozione completa del loro sito dall’indice di ricerca

Tecniche di cloaking

I gestori di siti web che ricorrono ai metodi black hat, uti­liz­za­no di regola due diverse tecniche per raggirare i motori di ricerca.

Agent Name Delivery

L’accesso a un sito web avviene di regola tramite un co­sid­det­to user agent. Esempi di user agent sono le ap­pli­ca­zio­ni lato client come browser web o programmi au­to­ma­tiz­za­ti come crawler dei motori ricerca. È possibile ri­co­no­scer­li tramite un iden­ti­fi­ca­ti­vo specifico: l’agent name. Questo permette a un server di adattare al relativo browser i contenuti richiesti tramite fogli di stile ot­ti­miz­za­ti e così di aumentare l’usabilità di un sito. Un agent name delivery crea pertanto la base per una vi­sua­liz­za­zio­ne ot­ti­miz­za­ta per i di­spo­si­ti­vi mobili. Un pro­ce­di­men­to del genere diventa però cloaking solo quando un gestore di un sito web integra de­ter­mi­na­ti mec­ca­ni­smi, che rea­gi­sco­no in modo ap­pro­pria­to agli agent name di crawler più co­no­sciu­ti come il Googlebot e for­ni­sco­no loro contenuti separati. Per eludere l’agent name delivery, i motori di ricerca camuffano pertanto i loro crawler con i comuni browser.

IP-Delivery

Oltre all’agent name, l’indirizzo IP offre la pos­si­bi­li­tà di ca­ta­lo­ga­re i gestori di siti web e di dotarli di contenuti par­ti­co­la­ri. Il pro­ce­di­men­to viene uti­liz­za­to nell’ambito del geo­tar­ge­ting, per mostrare ai vi­si­ta­to­ri di siti web diverse versioni lin­gui­sti­che od offerte regionali. L’IP delivery diventa cloaking se un gestore di un sito web offre contenuti per­so­na­liz­za­ti agli indirizzi IP standard di un crawler. Questo tipo di SEO black hat ha successo però solo se il relativo bot utilizza sempre lo stesso indirizzo IP. Per evitare questa ma­ni­po­la­zio­ne, la maggior parte dei motori di ricerca utilizza indirizzi IP alternati.

In un video ufficiale su questo tema Matt Cutts (l’allora capo del team Webspam di Google) spiega in modo piuttosto chiaro che il geo­tar­ge­ting basato su IP e l’adat­ta­men­to dei contenuti di siti web agli user agent Mobile non vengono in alcun modo con­si­de­ra­ti cloaking, bensì misure vo­lon­ta­rie ai fini di mi­glio­ra­re l’usabilità per l’utente. Di con­se­guen­za per Google non ha alcuna im­por­tan­za se un utente francese vi­sua­liz­zi altri contenuti a causa di versioni lin­gui­sti­che par­ti­co­la­ri rispetto a un utente tedesco, purché i contenuti siano coerenti con quello che un crawler trova sul sito Internet.

Consigli per i gestori di siti web

Il leader di mercato Google dà due consigli es­sen­zia­li ai gestori di siti che vor­reb­be­ro escludere il rischio di un effetto cloaking in­vo­lon­ta­rio:

  • I contenuti di siti web do­vreb­be­ro essere rea­liz­za­ti in modo tale che gli utenti reali e i crawler vi­sua­liz­zi­no sempre gli stessi contenuti.
  • Righe di codice che cercano esat­ta­men­te l’agent name o l’indirizzo IP di un crawler, sono sospetti e an­dreb­be­ro evitati.

Andrebbe inoltre evitata un’ela­bo­ra­zio­ne basata sui motori di ricerca di contenuti difficili da ana­liz­za­re per i craweler sotto forma di una versione web separata solo per i bot. Al contrario invece immagini, video o ani­ma­zio­ni flash do­vreb­be­ro avere una de­scri­zio­ne nei relativi meta tag.

Su Google Search Console potete vedere come i bot di Google vi­sua­liz­za­no il vostro sito. 

Vai al menu prin­ci­pa­le