Contenuto duplicato: come trovarlo ed evitarlo

Uno dei principi più importanti dell’ottimizzazione per i motori di ricerca è l’unicità del contenuto. Questo assicura un miglior posizionamento del sito web tra i risultati di ricerca e rende l’esperienza utente più positiva. Ciò si pone alla base di una content strategy di successo.

L’opposto del contenuto unico è rappresentato dal cosiddetto contenuto duplicato. Il termine descrive blocchi di testo o intere pagine web che appaiono duplicati su più URL. Evitare questo tipo di contenuti a favore di contenuti unici è importante per un’ottimizzazione di successo per i motori di ricerca. Ciò perché i contenuti duplicati influenzano negativamente il posizionamento e l’usabilità del sito web.

Il Black Friday di IONOS

Risparmia fino al 98% su un'ampia selezione di prodotti.

Offerta valida fino al 29 novembre.

Web hosting
WordPress
Domini

Cos’è il contenuto duplicato?

Il termine contenuto duplicato si riferisce a pagine web o passaggi testuali che appaiono duplicati su più di un URL.

Generalmente si distingue tra due tipi di contenuto duplicato:

  • Il contenuto duplicato interno: si riferisce a un contenuto duplicato su un singolo dominio.
  • Il contenuto duplicato esterno: si trova invece su più domini.

Entrambi i termini si riferiscono a pagine o blocchi di testo che sono condivisi senza modificazioni. Quando invece il contenuto non è conforme al 100 percento ma quasi identico, si parla di contenuto quasi duplicato.

Esempi comuni di contenuto duplicato

La maggior parte dei proprietari di siti web sono consapevoli degli effetti negativi del contenuto duplicato e decidono quindi di evitarlo. Tuttavia, il contenuto duplicato interno è molto comune ed è spesso dovuto a cause tecniche. È possibile trovare maggiori informazioni al riguardo nel paragrafo “Cause tecniche per il contenuto duplicato”.

Molte volte, lo stesso contenuto può essere trovato di continuo in diverse sottopagine dello stesso dominio. I negozi online in particolare riscontrano difficoltà al riguardo. Quando un prodotto è assegnato a diverse categorie o è disponibile in diverse varianti, la descrizione del prodotto è spesso, a grandi linee, la stessa su più pagine. Ciò viene considerato come contenuto duplicato. Inoltre, i PDF contenenti informazioni su un dato prodotto sono comunemente sottovalutati. Tuttavia, se il loro contenuto corrisponde a quello di una pagina di destinazione del prodotto stesso, vengono contati come contenuto duplicato. Un ulteriore esempio è lo slogandella filosofia aziendale che può apparire in diverse sottopagine.

I negozi online sono spesso colpiti anche da casi di contenuto duplicato esterno. Ad esempio, quando si acquistano dei prodotti da un grossista, altri rivenditori potrebbero utilizzare le stesse descrizioni di prodotto sui loro siti web. In questo caso, un contenuto identico non solo influenza negativamente il posizionamento nei motori di ricerca, ma anche la decisione di acquisto dei potenziali clienti. Se la presentazione di un prodotto non differisce tra i rivenditori, è il prezzo che decide. Per questa ragione è consigliato usare delle descrizioni di prodotto uniche e controllare regolarmente che non siano state copiate da altri rivenditori.

Il contenuto duplicato esterno si crea anche quando si copiano dei contenuti di terze parti, anche se frutto di una cooperazione e avendo il consenso dell’autore. Anche le versioni di un sito web in diverse lingue e per paesi differenti su diversi nomi di dominio rappresentano un rischio di contenuto duplicato esterno.

Fai SEO con rankingCoach di IONOS!

Migliora il tuo ranking su Google ottimizzando il tuo sito web senza conoscenze tecniche!

Facile
Ideato per te
Supporto 24/7

Perché il contenuto duplicato è problematico?

I motori di ricerca come Google usano un algoritmo per valutare tutti i siti web potenzialmente rilevanti e si servono di criteri prestabiliti per determinare l’ordine in cui vengono visualizzati i risultati di una ricerca. Lo scopo di questa valutazione è di presentare all’utente il contenuto più rilevante in cima alla classifica.

Se lo stesso contenuto appare su diversi siti web, i motori di ricerca non riescono a eseguire una valutazione adeguata. Ciò complica l’assegnazione di affidabilità, pertinenza e autorità e, di conseguenza, anche la creazione di una classifica. Generalmente, i motori di ricerca evitano di indicizzare più volte lo stesso contenuto e di mostrarlo nei risultati di ricerca, poiché ciò non offre alcun valore aggiunto agli utenti. Pertanto, il posizionamento delle pagine che contengono contenuti duplicati diminuirà.

A causa degli effetti negativi dei contenuti duplicati, vengono particolarmente temuti i cosiddetti web scrapers. Questo tipo di software copia i siti web biunivocamente. Un motore di ricerca come Google può riconoscere i siti scraper in base a vari parametri distinguendoli dai “veri” siti web.

Dal 25 al 35 percento circa del contenuto di tutti i siti web è duplicato. Tuttavia, il contenuto duplicato non è necessariamente una cosa negativa. Il video riportato di seguito spiega come vengono trattati i contenuti duplicati da Google e cosa è consigliato evitare in ogni caso:

Come individuare i contenuti duplicati?

Consigliamo di controllare regolarmente il vostro sito web per identificare dei possibili contenuti duplicati. In molti casi, ciò accade senza che l’operatore del sito web ne sia a conoscenza, per esempio quando vengono create nuove pagine o quando i link interni sono incoerenti. Di seguito riportiamo i metodi più comuni di cui si può usufruire per rintracciare i contenuti duplicati.

Controllare il proprio sito web manualmente

Se il vostro sito web consiste in un numero limitato di sottopagine, è una buona idea controllarle manualmente. Prestate particolare attenzione alle sezioni di testo utilizzate più volte nel sito web. Tipicamente queste sezioni sono le dichiarazioni o presentazioni aziendali o una call to action.

Sospettate che un modulo di testo ricorra più di una volta? In questo caso, una ricerca su Google può aiutare. Inserite il testo tra virgolette nella casella di ricerca e controllate se nei risultati della ricerca appaiono URL diversi del vostro stesso sito web.

Consiglio

Google nasconde realmente i risultati di ricerca duplicati per mostrare agli utenti solo la pagina rilevante. Tuttavia, se si riavvia la ricerca, i risultati precedentemente nascosti saranno visualizzati nel ranking.

Cercare il contenuto duplicato utilizzando degli strumenti d’analisi

Le ricerche manuali richiedono molto tempo, specialmente nel caso di un gran numero di sottopagine o per l’e-commerce. Dato che molti operatori di siti web affrontano questo problema, sono disponibili vari strumenti che cercano automaticamente i contenuti duplicati.

La Google Search Console è un servizio di analisi gratuito e utile che supporta l’ottimizzazione per i motori di ricerca e la ricerca di contenuti duplicati interni. La console trova le parole chiave dominanti grazie alle quali un sito web viene trovato e visto, e consente di utilizzare dei filtri per rispondere a delle richieste esatte. Nel caso in cui lo strumento elenchi più sottopagine, è possibile controllarle per verificare la presenza di contenuto duplicato. Facendo clic sull’opzione “Copertura” nella categoria “Indicizzazione”, alla voce “Pagine escluse”, è possibile visualizzare le sottopagine che sono state identificate come duplicate e di conseguenza escluse.

Per scoprire dei contenuti duplicati esterni, sarà invece necessario uno strumento di analisi come Copyscape o Siteliner. Tramite questi, basterà inserire l’URL di un sito web per visualizzare tutte le pagine interne ed esterne aventi un contenuto corrispondente allo stesso URL.

Come evitare il contenuto duplicato?

Finora abbiamo illustrato come individuare il contenuto duplicato. Tuttavia, sarebbe meglio evitarlo del tutto. I consigli riportati di seguito dovrebbero aiutare:

  • Create delle sottopagine che siano chiaramente distinguibili tematicamente e usate diverse parole chiave principali in ogni pagina. Il modo migliore per tenere traccia delle cose è quello di elaborare una strategia per le parole chiave in anticipo.
  • Evitate di inserire paragrafi generici su diverse sottopagine.
  • Evitate di copiare testi già scritti (a meno che non si tratti di una citazione designata o di una clausola legale).
  • Fate attenzione alla coerenza dei link interni ed evitate voci diverse per lo stesso URL. Queste sono tipicamente create aggiungendo index.htm all’URL della homepage o attraverso varianti con o senza lo slash finale (/).
  • Utilizzate dei domini di primo livello per versioni della vostra pagina web in lingue diverse o per paesi diversi quali "www.example.com", invece di sottodomini come "www.example.org/en".

Generalmente non è possibile influenzare la creazione di contenuto duplicato esterno se altri webmaster copiano il vostro contenuto. Per questo motivo si consiglia di inizare l’indicizzazione manualmente dopo aver creato una nuova pagina. Se il vostro sito web, con il rispettivo contenuto, è indicizzato in prima pagina verrà classificato come l’originale.

Cause tecniche del contenuto duplicato

Spesso delle cause tecniche portano alla creazione di un contenuto duplicato interno senza che l’operatore del sito web ne sia a conoscenza. È quindi consigliato controllare la propria presenza online in merito ai seguenti punti:

Varianti multiple di un indirizzo web

Quando si passa a un HTTPS (Hypertext Transfer Protocol Secure) criptato, è importante impostare l’inoltro dall’indirizzo web precedente. Ciò perché se il sito web precedente rimane accessibile tramite http://, viene creato un contenuto duplicato al 100 percento!

Bisogna assicurarsi di controllare se il sito web può essere raggiunto usando diverse grafie. Esempi tipici includono:

  • Una homepage accessibile tramite index.php e anche con o senza slash finale.
  • Un sito web accessibile con o senza www come parte dell’URL.
  • Un URL sensibile alle maiuscole e alle minuscole.

Se vengono individuati due o più URL che portano alla stessa sottopagina, bisognerà impostare un reindirizzamento 301 alla pagina principale per tutte le varianti.

Altre misure tecniche

  • Se il vostro sito ha versioni in lingue o paesi diversi, bisognerà contrassegnarle con l’attributo hreflang per evitare contenuti duplicati.
  • Controllate i vostri parametri URL. Spesso vengono creati molti URL unici che portano allo stesso contenuto. Questa è una causa comune di contenuto duplicato, specialmente per i filtri nei negozi online.
  • Fate attenzione agli ID di sessione facenti parte di un URL. Ciò perché i crawler possono ricevere un nuovo ID ogni volta che si accede a una sottopagina e quindi raggiungere un nuovo URL.
  • Escludete dall’indicizzazione le versioni stampabili dei siti web.

Come gestire il contenuto duplicato correttamente

La copia manipolativa e intenzionale di contenuti di terzi è vietata per motivi di copyright e conformemente alle linee guida di Google. Tuttavia, il verificarsi di contenuti duplicati online è molto comune e non è punibile direttamente. Ciononostante, è consigliabile evitare i contenuti duplicati quando possibile.

Se un sito web contiene due o più sottopagine con contenuti simili o identici, è possibile unire i contenuti in un’unica pagina o ampliare le rispettive sottopagine aggiungendo contenuti unici e parole chiave individuali per ottimizzare il loro contenuto SEO. L’opzione migliore delle due dipenderà dalla rilevanza delle pagine stesse e dalla possibilità di rafforzare le parole chiave.

Scegliete delle parole chiave più forti per i titoli, la meta descrizione e il meta titolo. Questo evita che siano classificati come contenuti duplicati e migliora il posizionamento della vostra pagina web nei motori di ricerca. Per modificare i testi esistenti e differenziarli, è consigliato utilizzare degli elenchi puntati, liste e tabelle, o integrare dei file multimediali, quali immagini e video.

N.B.

I motori di ricerca possono individuare elementi ripetuti nei piè di pagina o nelle intestazioni, i quali tuttavia non vengono considerati come contenuti duplicati. In questo caso, non è necessario creare un contenuto diverso per ogni sottopagina.

Se si vuole condividere dei contenuti esistenti, ad esempio un articolo di un blog o un comunicato stampa da altri siti, è possibile utilizzare un tag canonicorel=“canonical” nell’intestazione. Così facendo, si dichiara l’URL selezionato come risorsa standard o URL originale. Il tag è invisibile agli utenti e rende comunque chiaro ai motori di ricerca il collegamento tra le pagine.

Consiglio

Il contenuto duplicato è solo un aspetto dell’ottimizzazione per i motori di ricerca. Il rankingCoach di IONOS ottimizza il vostro sito web passo dopo passo con l’aiuto di utili video tutorial.


Sconti Black Friday
Approfitta dei nostri sconti su domini, web hosting, WordPress e tanto altro. Offerta valida solo fino al 29 novembre!
Fino al -98%