Non tutti i contenuti che esistono sui siti web e nei negozi online sono li­be­ra­men­te di­spo­ni­bi­li per tutti gli utenti e i motori di ricerca. Questi contenuti ad accesso limitato rientrano nella categoria de­no­mi­na­ta “deep web”. Le ragioni per le re­stri­zio­ni di accesso possono essere mol­te­pli­ci.

Acquista e registra il tuo dominio con il provider n°1 in Europa
  • Domain Connect gratuito per una con­fi­gu­ra­zio­ne facile del DNS
  • Cer­ti­fi­ca­to SSL Wildcard gratuito
  • Pro­te­zio­ne privacy inclusa

Deep web: de­fi­ni­zio­ne

Molte persone pro­ba­bil­men­te non hanno fa­mi­lia­ri­tà con il “deep web”: si tratta del termine generico uti­liz­za­to per tutti i tipi di dati a cui non si può accedere sem­pli­ce­men­te tramite un motore di ricerca o inserendo un URL. Si tratta di una gran parte dei dati e delle pagine di­spo­ni­bi­li su Internet, per esempio database di aziende, uni­ver­si­tà e musei vi­si­ta­bi­li solo tramite un login, conti bancari, carrelli della spesa, account utente di negozi online e altro. In senso stretto, il deep web comprende anche il dark web, anche se questi contenuti dif­fe­ri­sco­no ul­te­rior­men­te tra di loro in misura si­gni­fi­ca­ti­va.

Dif­fe­ren­ze tra deep web, dark web e Internet

Co­min­cia­mo con una chiara de­fi­ni­zio­ne di Internet, in base alle nostre co­no­scen­ze: tutti i motori di ricerca, i siti di notizie, i negozi online e le homepage che possiamo ri­chia­ma­re tramite un browser come Chrome o Firefox e per i quali non sono richiesti ulteriori dati di login, fanno parte fon­da­men­tal­men­te del surface web o visible web; anche se in tale ambito vi è una tran­si­zio­ne “senza soluzione di con­ti­nui­tà”, ovvero è presente una parte di contenuti che già ap­par­tie­ne al deep web dal punto di vista dei motori di ricerca. Maggiori in­for­ma­zio­ni al riguardo sono riportate nei paragrafi sot­to­stan­ti.

Il deep web, che rap­pre­sen­ta una quota si­gni­fi­ca­ti­va­men­te maggiore rispetto all’intero Internet, include tutti i contenuti con accesso limitato. Google e altri motori di ricerca non possono in­di­ciz­za­re questi dati.

All’interno del deep web è presente il dark web, dove l’accesso è ancora più for­te­men­te re­go­la­men­ta­to ed è possibile solo at­tra­ver­so tec­no­lo­gie speciali. A causa delle li­mi­ta­zio­ni e del totale anonimato del dark web, questo co­sti­tui­sce purtroppo una sorta di calamita per le attività criminali. Nei paragrafi seguenti, il termine “deep web” si riferisce uni­ca­men­te ai contenuti descritti nel paragrafo pre­ce­den­te, ma non al contenuto del dark web.

Perché i contenuti non si trovano sul deep web

Come già il­lu­stra­to in pre­ce­den­za, una possibile ragione per cui il contenuto non viene trovato e in­di­ciz­za­to dai crawler del motore di ricerca è la re­stri­zio­ne di accesso tramite un login o la richiesta di una password. Ulteriori ostacoli possono essere rap­pre­sen­ta­ti anche dal consenso alle con­di­zio­ni di utilizzo o da una barriera di pagamento. In tutti questi casi, in qualità di utenti potete accedere all’URL solo se avete pre­ce­den­te­men­te inserito una password o avete accettato il pagamento.

Esiste, però, anche un altro caso sul deep web. È possibile ri­chia­ma­re la pagina solo se l’URL è noto; il crawler di un motore di ricerca, tuttavia, non la trova e non la indicizza ancora. Le ragioni sono mol­te­pli­ci.

Da un lato, i webmaster possono escludere spe­ci­fi­ca­men­te i contenuti dall’in­di­ciz­za­zio­ne uti­liz­zan­do il comando Nofollow; dall’altra è possibile che una pagina sia nascosta in un sito web in modo tale che il crawler non possa trovarla. Per ogni sito web, il crawler ha solo un de­ter­mi­na­to “page budget”: se questo è esaurito e ci sono ancora altre pagine a un livello inferiore, queste non vengono prese in con­si­de­ra­zio­ne. Una terza pos­si­bi­li­tà è la mancanza di requisiti tecnici per l’in­di­ciz­za­zio­ne, per esempio se si usa Flash.

Cosa implicano i contenuti del deep web per il vostro sito web

In linea di principio, i contenuti del deep web non co­sti­tui­sco­no alcun problema per voi e per i vi­si­ta­to­ri del vostro sito web. Al contrario, queste pagine si trovano su quasi tutti i prin­ci­pa­li siti web o nei negozi online e gli utenti ef­fet­tua­no il login in modo ab­ba­stan­za naturale.

La mancanza di in­di­ciz­za­zio­ne da parte di Google, tuttavia, diventa un fattore si­gni­fi­ca­ti­vo in relazione all’ot­ti­miz­za­zio­ne per i motori di ricerca. Spe­cial­men­te con argomenti scien­ti­fi­ci o medici, molti contenuti rilevanti sono spesso soggetti a una re­stri­zio­ne di accesso. Tuttavia, l’obiettivo dovrebbe essere quello di rendere li­be­ra­men­te ac­ces­si­bi­li e in­di­ciz­za­bi­li quanti più contenuti possibili (nella misura in cui sia con­sen­ti­to dalle leggi vigenti e dalla politica aziendale), o perlomeno di pro­get­ta­re pagine di de­sti­na­zio­ne che diano al motore di ricerca una vaga idea di ciò che si può (ancora) trovare sul vostro sito web.

Vai al menu prin­ci­pa­le