Chi si preoccupa in­ten­sa­men­te del ranking del proprio sito web nelle pagine dei risultati dei motori di ricerca sa esat­ta­men­te quanti fattori diversi in­fluen­za­no la lotta per i primi posti. Ad esempio l'elenco dei fattori che in­fluen­za­no il ranking di Google comprende oltre 200 criteri, alcuni dei quali sono stati con­fer­ma­ti uf­fi­cial­men­te dal­l'a­zien­da, mentre altri sono stati solamente dedotti da esperti.

Non è un caso che l'ot­ti­miz­za­zio­ne per i motori di ricerca faccia parte da anni del re­per­to­rio standard di ogni webmaster che vuole che il proprio sito web sia visibile e ac­ces­si­bi­le. Mentre fattori come keyword rilevanti, contenuti di alta qualità o un alto livello di re­spon­si­vi­tà sono sulla bocca di tutti, il valore di una buona sitemap XML è spesso sot­to­va­lu­ta­to.

Cos’è una sitemap XML?

Una sitemap XML (sitemap.xml) è un file di testo in formato XML (Extensible Markup Language) che contiene un elenco di tutte le sot­to­pa­gi­ne di un sito web sotto forma di link. Come tale, può essere caricato nella Google Search Console o su Bing Webmaster Tools per no­ti­fi­ca­re ai crawler dei motori di ricerca tutte le pagine di­spo­ni­bi­li e rilevanti, ve­lo­ciz­zan­do e ot­ti­miz­zan­do così il processo di in­di­ciz­za­zio­ne.

Le sitemap XML devono sod­di­sfa­re i requisiti del pro­to­col­lo Sitemap, che è stato adottato come standard da Google, Yahoo e Microsoft nel 2006 con l'o­biet­ti­vo di mi­glio­ra­re la qualità dei risultati di ricerca forniti nel lungo periodo. Pertanto sono ob­bli­ga­to­ri la codifica in UTF-8 e il già uti­liz­za­to lin­guag­gio di markup XML nonché l'uso di codici entità per alcuni caratteri (come "&gt" invece di ">").

N.B.

Le sitemap XML sono diverse dalle sitemap che molti CMS vi­sua­liz­za­no au­to­ma­ti­ca­men­te sul front end. In quest’ultimo caso si tratta del­l'in­di­ce del sito web che ha lo scopo di rendere la na­vi­ga­zio­ne più facile ai vi­si­ta­to­ri, mentre di default le sitemap non sono visibili agli utenti, anche se è ge­ne­ral­men­te possibile renderle ac­ces­si­bi­li tramite il loro URL.

I vantaggi di una sitemap XML

Anche se non vi è alcuna garanzia che l'in­di­ciz­za­zio­ne su Google e simili sia ot­ti­miz­za­ta dall’uso di sitemap XML, quel che è certo è che le directory di link strut­tu­ra­te con­tri­bui­sco­no ad au­men­tar­ne le pos­si­bi­li­tà. L'indice adatto ai crawler può dare i suoi frutti, so­prat­tut­to per le pagine con contenuti dinamici soggette a continui cam­bia­men­ti. Lo stesso vale per i progetti web più grandi che hanno un gran numero di sot­to­pa­gi­ne ma non (ancora) una grande struttura di backlink. Tali pagine tendono a essere con­trol­la­te troppo raramente in cerca di ag­gior­na­men­ti o vengono ad­di­rit­tu­ra ignorate dai radar dei motori di ricerca. Grazie a sitemap.xml è però possibile portarle più ra­pi­da­men­te al centro del­l'at­ten­zio­ne dei bot di in­di­ciz­za­zio­ne.

Un altro vantaggio delle XML sitemap è che sono in grado di elencare non solo gli URL di sot­to­pa­gi­ne, ma anche di file mul­ti­me­dia­li come video o immagini. Per questi ci sono anche tag extra che indicano al crawler di che tipo di contenuto si tratta (<image>, <video>). Inoltre è possibile uti­liz­za­re degli attributi che de­scri­vo­no il contenuto in modo più det­ta­glia­to o spe­ci­fi­ca­no la durata in modo che i motori di ricerca possano cat­tu­rar­lo in modo ottimale. C'è anche una versione speciale delle sitemap XML per i portali di news, che promette un'in­di­ciz­za­zio­ne ot­ti­miz­za­ta degli articoli grazie ad attributi specifici come il genere, la data di pub­bli­ca­zio­ne o il titolo.

Consiglio

L’impegno ne­ces­sa­rio per creare ma­nual­men­te una sitemap XML dovrebbe essere visto come uno svan­tag­gio di una tale directory strut­tu­ra­le per il proprio sito web. Tuttavia, grazie ai ge­ne­ra­to­ri di sitemap come quello online di Sitemaps.com, non c'è bisogno di oc­cu­par­se­ne da soli. Per la maggior parte dei Content Ma­na­ge­ment System sono anche di­spo­ni­bi­li dei plug-in che au­to­ma­tiz­za­no la creazione di sitemap XML.

Generare una sitemap XML: quali sono i com­po­nen­ti prin­ci­pa­li?

Come per qualsiasi documento nel lin­guag­gio di Ex­ten­si­ble Markup, la for­mat­ta­zio­ne di ogni sitemap XML funziona con tag XML. Secondo l'attuale standard "Sitemaps 0.9", sono tre i tag ob­bli­ga­to­ri per poter parlare di una sitemap XML:

sitemap.xml: tag ob­bli­ga­to­ri
<urlset>, </urlset> Ogni file sitemap XML deve iniziare con un tag <urlset> di apertura e finire con un tag </urlset> di chiusura. Il tag ha la funzione di rias­su­me­re il file e si riferisce allo standard di pro­to­col­lo corrente.
<url>, </url> I tag <url> di apertura e chiusura sono so­vraor­di­na­ti alle singole voci dell'URL e indicano quindi l'inizio e la fine di una sot­to­pa­gi­na elencata.
<loc>, </loc> Il tag <loc> iden­ti­fi­ca le singole pagine del progetto web o i loro URL. L'URL deve sempre iniziare con il pro­to­col­lo (ad es. "http") e terminare con una barra di chiusura (se richiesto dal server web). Viene inoltre definita una lunghezza massima di 2.048 caratteri.

Oltre a questi attributi XML ob­bli­ga­to­ri, <priority>, <lastmod> e <chan­ge­freq> rap­pre­sen­ta­no tre tag ag­giun­ti­vi per spe­ci­fi­ca­re le singole voci URL. Tuttavia la misura in cui questi tag opzionali sono sup­por­ta­ti dipende anche dal ri­spet­ti­vo motore di ricerca. Ad esempio il crawler di Google utilizza prin­ci­pal­men­te i markup <lastmod> per l'in­di­ciz­za­zio­ne, mentre ignora in gran parte gli altri due attributi o consente loro di confluire solo in minima parte nel processo di crawling.

sitemap.xml: tag opzionali
<lastmod>, </lastmod> Tramite il tag <lastmod> è possibile spe­ci­fi­ca­re la data (in formato W3C) dell'ultima modifica di una pagina. Il tag è in­di­pen­den­te dal­l'hea­der "if modified since" ("se mo­di­fi­ca­to da") che il server web può re­sti­tui­re come parte di una risposta HTTP 304.
<chan­ge­freq>, </chan­ge­freq> Il tag <chan­ge­freq> fornisce al crawler in­for­ma­zio­ni generali sulla frequenza con cui si prevede di ag­gior­na­re una pagina (oraria, gior­na­lie­ra, mensile e così via). I documenti che cambiano ad ogni accesso sono con­tras­se­gna­ti con il valore "always" ("sempre"), gli URL ar­chi­via­ti con "never" ("mai").
<priority>, </priority> Con questo tag la priorità di un URL al­l'in­ter­no del­l'in­te­ro progetto web può essere espressa su una scala da 0.0 a 1.0 (priorità pre­de­fi­ni­ta: 0.5). In questo modo i crawler possono essere informati delle pagine la cui in­di­ciz­za­zio­ne è par­ti­co­lar­men­te im­por­tan­te.

Poiché un file Sitemap XML può contenere un massimo di 50.000 URL e non può superare i 50 MB, la raccolta di URL di siti web di grandi di­men­sio­ni può anche essere di­stri­bui­ta su più documenti. In questo caso, tuttavia, ogni documento della sitemap dovrebbe essere elencato in un file indice sup­ple­men­ta­re la cui struttura non dif­fe­ri­sca in linea di principio da quella dei file della sitemap: i tag <si­te­ma­pin­dex> e <sitemap> devono essere usati al posto di <urlset> e <url>.

N.B.

È possibile com­pri­me­re i file sitemap (ad esempio con gzip), ma solo per ridurre i requisiti di larghezza di banda. La di­men­sio­ne massima di una sitemap XML non può essere aumentata in questo modo, poiché il limite si applica sempre alla versione estratta del file.

Esempio di sitemap XML

Il modo più semplice per com­pren­de­re la struttura di una sitemap XML è quello di usare un esempio concreto:

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

In questo caso l’esempio di sitemap XML elenca l'URL prin­ci­pa­le di one-test.website e gli URL di due sot­to­pa­gi­ne (page1 e page2). I crawler dei motori di ricerca possono vedere dal documento che il webmaster ha dato la massima priorità alla pagina prin­ci­pa­le e che le modifiche vengono ef­fet­tua­te con cadenza più o meno mensile.

L'ultima modifica è stata ef­fet­tua­ta il 1° gennaio 2018. La pagina page1 ha il valore di priorità di default (0.5), ma a dif­fe­ren­za della pagina prin­ci­pa­le si stima che venga mo­di­fi­ca­to set­ti­ma­nal­men­te, con l'ultima modifica ef­fet­tua­ta il 5 marzo 2018. Se il crawler lavora con l'attributo di priorità sitemap, sa di dover prestare poca at­ten­zio­ne a page2 durante l'in­di­ciz­za­zio­ne (valore <priority>: 0.3). Anche la parte inferiore è mo­di­fi­ca­ta set­ti­ma­nal­men­te (l'ultima modifica è dell'8.3.2018).

Come creare sitemap XML e con­se­gnar­le

Data l'enorme quantità di lavoro ne­ces­sa­rio per creare ma­nual­men­te sitemap, ricorrere a plug-in o strumenti online è sempre la decisione giusta, a patto che vengano uti­liz­za­ti cor­ret­ta­men­te. Na­tu­ral­men­te è possibile creare sitemap XML decenti anche senza con­fi­gu­ra­zio­ni spe­ci­fi­che, ma solo con im­po­sta­zio­ni in­di­vi­dua­li ap­pro­pria­te le directory delle strutture generate ottengono la forma de­si­de­ra­ta. A titolo esem­pli­fi­ca­ti­vo vi pre­sen­tia­mo le pos­si­bi­li­tà offerte dal ge­ne­ra­to­re online di XML-Sitemaps.com e il plug-in WordPress Google XML Sitemaps per la creazione e l'in­te­gra­zio­ne di sitemap XML.

Come creare una sitemap XML con il ge­ne­ra­to­re online di XML-Sitemaps.com

Dal 2005 il ge­ne­ra­to­re online di XML-Sitemaps.com offre agli utenti una soluzione con­ve­nien­te per creare le proprie sitemap XML. Il servizio web è gratuito per progetti web con un massimo di 500 sot­to­pa­gi­ne, mentre le sitemap di progetti più grandi possono essere create solo previo ab­bo­na­men­to a pagamento. La procedura è molto semplice: dopo aver aperto l'ap­pli­ca­zio­ne web inserite l'URL del proprio sito web nella barra degli indirizzi fornita a tale scopo.

Uti­liz­za­te il pulsante "More options" ("Altre opzioni") per spe­ci­fi­ca­re se e in quale misura le voci della sitemap debbano essere spe­ci­fi­ca­te tramite l'at­tri­bu­to <lastmod>, <priorità> o <chan­ge­freq>. Il primo può essere attivato o di­sat­ti­va­to, mentre il secondo consente di impostare la frequenza di ag­gior­na­men­to de­si­de­ra­ta (oraria, gior­na­lie­ra, set­ti­ma­na­le, ecc.), nel caso in cui si desideri uti­liz­za­re questa opzione di eti­chet­ta­tu­ra. Al­tri­men­ti è suf­fi­cien­te mantenere l'im­po­sta­zio­ne pre­de­fi­ni­ta "Do not specificy" ("Non spe­ci­fi­ca­re").

Cliccando su "START" si avvia il processo di ge­ne­ra­zio­ne, la cui durata dipende dalle di­men­sio­ni del progetto web. Una volta com­ple­ta­to il processo, è possibile vi­sua­liz­za­re il risultato sotto "VIEW SITEMAP DETAILS" ("vedi dettagli della sitemap") -> "VIEW FULL XML SITEMAP" ("vedi sitemap XML completa").

Usate il pulsante di download per scaricare il file sitemap generato e caricarlo nella directory prin­ci­pa­le del vostro sito web. Per informare il crawler di Google dell’esistenza del vostro file, è suf­fi­cien­te inviarlo alla Google Search Console, azione che richiede l’aggiunta del proprio sito web come proprietà su Google. In al­ter­na­ti­va è possibile spe­ci­fi­ca­re il percorso in cui la mappa del sito può essere trovata in qualsiasi punto del file robots.txt:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: come creare una sitemap XML con il plug-in di WordPress

Da oltre un decennio il plug-in di WordPress Google XML Sitemap, svi­lup­pa­to da Arne Brachhold, rende la ge­ne­ra­zio­ne di sitemap XML dei propri progetti un gioco da ragazzi. Per uti­liz­za­re il popolare plug-in, che ha all’attivo oltre 2 milioni di in­stal­la­zio­ni attive in tutto il mondo, per il vostro sito web WordPress, in­stal­la­te­lo per prima cosa tramite il “centro plug-in” del sistema del CMS.

Se­le­zio­na­te la voce di menu "Plugin", quindi "Installa" e immettete "Google XML Sitemaps" nella maschera di ricerca. Cliccando su "Installa ora" si avvia il processo di in­stal­la­zio­ne del­l'e­sten­sio­ne, che dovrebbe apparire nella parte superiore dei risultati pre­sen­ta­ti:

In al­ter­na­ti­va è possibile scaricare Google XML Sitemaps ma­nual­men­te e inserirlo nella directory dei plug-in del vostro progetto WordPress. Se suc­ces­si­va­men­te attivate l’esten­sio­ne è possibile ri­chia­mar­la di­ret­ta­men­te all’interno di WordPress dalla voce "Sitemap XML" nel menu "Im­po­sta­zio­ni". Rispetto a XML-Sitemaps.com, è di­spo­ni­bi­le un numero si­gni­fi­ca­ti­va­men­te maggiore di opzioni di con­fi­gu­ra­zio­ne nelle seguenti sette sezioni:

  • Im­po­sta­zio­ni generali: qui si de­fi­ni­sco­no le im­po­sta­zio­ni di base e si sta­bi­li­sce, ad esempio, se Google e Bing debbano essere informati au­to­ma­ti­ca­men­te delle modifiche o se la sitemap debba essere compressa au­to­ma­ti­ca­men­te.
  • Ad­di­tio­nal Pages: in questa sezione è possibile ag­giun­ge­re file o URL che non fanno parte del progetto WordPress ma che vengono eseguiti sullo stesso dominio.
  • Priorità dei post: le re­go­la­zio­ni di questo menu sono di par­ti­co­la­re interesse per i blog e i portali di notizie. Se si lavora con il tag <priority> nella mappa del sito, definite a questo punto se e come il plug-in debba calcolare la priorità di un post.
  • Contenuto della sitemap: uti­liz­za­te questo menu per se­le­zio­na­re le categorie di pagine da includere nella sitemap (ad esempio homepage, pagine statiche, pagine di archivio, ecc.).
  • Excluded Items: se volete escludere categorie o singoli post dal­l'in­di­ciz­za­zio­ne, potete farlo qui.
  • Change Fre­quen­cies: Google XML Sitemaps fornisce la pos­si­bi­li­tà di pre­im­po­sta­re il tag <chan­ge­freq>. La frequenza di ag­gior­na­men­to può anche essere impostata se­pa­ra­ta­men­te per i diversi tipi di pagina.
  • Priorità: qui sono riportate le stesse im­po­sta­zio­ni per l'at­tri­bu­to <priorità>.

Una volta che avete pro­get­ta­to il setup della sitemap secondo le vostre esigenze, salvate le modifiche uti­liz­zan­do il pulsante cor­ri­spon­den­te. Facendo clic sul link "your sitemap" dopo aver salvato, tra­smet­te­te la sitemap XML ai crawler se­le­zio­na­ti del motore di ricerca.

Vai al menu prin­ci­pa­le