Trovare vecchi siti web con Wayback Machine e altri archivi online

Indice

Spesso sorge la necessità di trovare o ripristinare vecchie pagine web. Con strumenti come Wayback Machine, la cache di Google o WebCite, puoi accedere a siti web antichi, ripristinare vecchi siti internet o trovare una vecchia homepage.

Crea il tuo sito web

Scopri le nuovi funzioni IA di MyWebsite

Editor facile e intuitivo con supporto IA
Immagini e testi d'effetto in pochi secondi
Dominio, indirizzo e-mail e certificato SSL inclusi

Perché può essere utile trovare e ripristinare vecchie pagine internet?

Pagine offline: problemi tecnici o servizi di hosting cancellati rendono i contenuti inaccessibili, ma grazie agli archivi rimangono conservati. In questo modo, è possibile trovare vecchie pagine web anche se il sito originale non esiste più.
Ricerca e verifica delle fonti: i giornalisti, i blogger e gli scienziati possono controllare le versioni precedenti e citarle in modo chiaro.
Scopi SEO: i contenuti archiviati aiutano a controllare i link, documentare le modifiche e sfruttare la potenza dei link di vecchi domini.
Conservazione delle prove legali: gli screenshot e i contenuti archiviati servono come prova in caso di insulti, minacce o processi di lavoro.

Progetto Internet Archive: vecchie pagine internet e altro

Internet Archive è un progetto non-profit di Brewster Kahle che archivia contenuti digitali dal 1996. Il cuore del progetto è Wayback Machine, con cui puoi trovare vecchi siti web e visualizzare screenshot storici, testi, immagini o video. I primi siti web archiviati risalgono al 1996. Wayback Machine contiene oltre 300 miliardi di pagine archiviate. Così, è possibile recuperare vecchie pagine internet e trovare un vecchio sito.

Oltre ai siti web, il progetto Internet Archive raccoglie anche:

Testi e libri
Registrazioni audio, inclusi concerti dal vivo
Video e contributi televisivi
Immagini
Programmi software

I contenuti provengono dalla comunità o sono donati dai titolari dei diritti. Molti contenuti provengono da università, organizzazioni governative o progetti di digitalizzazione come Project Gutenberg e LibriVox.

Tutorial su Wayback Machine: trovare vecchie pagine web e archiviarle

Se i contenuti del tuo sito web vengono persi o desideri visualizzare versioni precedenti di una pagina, Wayback Machine può aiutarti. In pochi passaggi puoi trovare vecchi siti web, accedere alle pagine e persino archiviarle.

Primo passaggio: inserire l’URL direttamente

Inserisci il dominio desiderato nella barra di ricerca in alto e premi Invio per accedere direttamente alla pagina dei risultati.

Digita semplicemente l’URL del sito che stai cercando nella barra di ricerca.

Secondo passaggio: accedere alla pagina principale di Wayback

Fai clic sull’icona gialla del web per andare alla pagina principale. Qui puoi inserire un URL di dominio e cliccare su “Browse History” per vedere le versioni archiviate.

Fai clic nell’archivio di Wayback Machine.

Terzo passaggio: cercare per parole chiave

Inserisci il termine di ricerca nella barra di ricerca inferiore e seleziona “search archived web sites”. Clicca su “Go” per ottenere l’elenco dei risultati, che mostra dominio, descrizione, snapshot e registrazioni multimediali.

Seleziona qui i criteri con cui desideri cercare un sito web.

Fatto

Uno snapshot è un’istantanea di un sito web. Gli elementi dinamici come i moduli non funzionano, ma i contenuti possono essere letti o copiati.

Quarto passaggio: utilizzare la timeline e gli snapshot

Per ogni URL archiviato, Wayback Machine mostra una timeline con colonne per il numero di snapshot per data. Nella vista del calendario, gli snapshot sono codificati a colori:

Blu: scansione riuscita
Verde: reindirizzamenti
Arancione: URL non trovato (4xx)
Rosso: errore del server (5xx)

Come utilizzare la timeline:

Clicca su una data segnata con un colore.
Seleziona la marca temporale desiderata per vedere lo screenshot del sito archiviato.
Naviga all’interno della pagina come di consueto e copia i contenuti se necessario.

I cerchi verdi e arancioni indicano che i crawler hanno registrato almeno un tentativo di reindirizzamento, che corrisponde all’URL non trovato. Tuttavia, ciò potrebbe non riguardare ogni tentativo di quel giorno.

Quinto passaggio: archiviare il proprio sito web (self-snapshot)

Non tutti i siti web vengono archiviati automaticamente. I motivi possono essere:

Un tag noindex o una voce corrispondente nel file robots.txt che ne evita l’indicizzazione
Contenuti protetti da password
Rimozione manuale dall’archivio
Contenuti dinamici che non vengono rilevati correttamente

Come proteggere il tuo sito web:

Vai alla pagina principale di Wayback Machine.
Utilizza il campo “Save Page Now” e inserisci il tuo dominio.

Inserisci qui il tuo dominio per salvare il sito.

Dopo poco tempo, Wayback Machine crea uno snapshot che viene salvato in modo permanente. In questo modo puoi trovare vecchi siti web anche se la pagina online non è più disponibile.

Consiglio

Per siti meno noti o regionali, vale la pena creare regolarmente propri snapshot.

Immagine: ION_IT_DG-TVC_MyWebsite_960x320.png

Immagine: ION_IT_DG-TVC_MyWebsite_1200x1200.png

Come scaricare vecchie pagine web?

Per un utilizzo più avanzato, ad esempio codice sorgente, link o test SEO, ci sono strumenti come:

Wayback-Machine-Downloader (GitHub, open source): scarica file HTML, file multimediali e pagine indice.
Archivarix (basato sul web): gratuito per siti fino a 200 file; download ZIP dopo registrazione.
HTTrack Website Copier: strumento classico per scaricare interi siti web (anche pagine di archivio, se si specificano gli URL di Wayback).

Archive.org non offre un downloader di siti web, ma permette di scaricare testi, immagini e file audio, se si dispone dei relativi diritti.

Alternativa 1: trovare siti web non così vecchi con la ricerca Google

Se l’informazione cercata è ancora relativamente attuale, una semplice ricerca su Google può bastare. I crawler di Google registrano le pagine web in modo simile a Wayback Machine e memorizzano uno snapshot nella cache. In questo modo viene mostrata l’ultima versione indicizzata della pagina. Se il sito live non è momentaneamente disponibile, è possibile utilizzare la cache. Rispetto ad archive.org, questo snapshot è spesso più aggiornato; tuttavia, vi è solo una marca temporale per versione.

Per richiamare la versione memorizzata nella cache di una pagina, puoi utilizzare direttamente il seguente comando nella barra degli indirizzi del tuo browser:

http://webcache.googleusercontent.com/search?q=cache:https://www.DOMAIN.com

In questo caso, sostituisci DOMAIN.com con l’URL desiderato. Tieni presente che anche gli snapshot di Google non mostrano la maggior parte degli elementi dinamici o dei contenuti multimediali.

Consiglio

Anche se una pagina è impostata su noindex e non appare nei risultati di ricerca, la cache può talvolta fornire una versione precedente.

Alternativa 2: accesso a siti web già archiviati con WebCite

WebCite consente di accedere a siti web già archiviati e di citarli. Tuttavia, attualmente non vengono più accettate nuove richieste di archiviazione. Gli snapshot già archiviati possono ancora essere consultati e utilizzati nelle citazioni. In questo modo è possibile ripristinare e aprire vecchie pagine web.

Per accedere a una versione archiviata di un sito web, visita il sito WebCite e utilizza la funzione di ricerca per inserire il dominio o l’ID dello snapshot. In questo modo puoi visualizzare le versioni precedenti dei siti web già archiviati e indicarle come fonte inalterabile.

Inserisci l’URL del dominio che stai ricercando nel campo di ricerca.

Articoli popolari

Vendere domini: come guadagnare con i domini?

Comprare e vendere domini può essere un'attività lucrativa, se si sa come procedere. Vi…

5 alternative a Nextcloud a confronto

Scopri le migliori alternative a Nextcloud, ideali per diverse esigenze di archiviazione…

I 7 migliori servizi di backup online a confronto

Salva i tuoi dati al sicuro nel cloud. Ti presentiamo 7 servizi per proteggere i tuoi…

Aggiornamento a Debian 13: come funziona

Questa guida ti mostra come eseguire un aggiornamento a Debian 13, preparare il tuo…

4 alternative gratuite a InDesign di Adobe

I software Adobe sono troppo costosi? Sul web sono disponibili alcune alternative gratuite…

Articoli simili

Laurent TShutterstock

Certificato SSL: definizione, validità e costi

La sicurezza su internet non perde mai di importanza: sia che gestisci un sito web, sia che navighi semplicemente in rete, dovresti comprendere assolutamente le basi della sicurezza web. Per questo motivo, ti spieghiamo cosa sono esattamente i certificati SSL, a cosa servono e…

Lessico
SSL

Golden DayzShutterstock

sitemap.xml: tutto quello che c’è da sapere su funzioni e generazione di una sitemap XML

Più un progetto web è ampio, più è importante che abbia una struttura adeguata e ordinata, così da facilitare l’orientamento e la ricerca di contenuto non solo ai visitatori, ma anche ai motori di ricerca. L’indicizzazione ideale è garantita anche dall'uso di sitemap XML: questi…

Tutorial
Conoscenza Web

UndreyShutterstock

Creare una pagina Wikipedia

Vi è mai passata per la testa l’idea di scrivere una pagina Wikipedia? Se vi siete spinti talmente in là da leggere i criteri da rispettare, vi siete certamente accorti che non è poi così facile. Per garantire che i contenuti lessicali siano veritieri e fattuali, Wikipedia…

Tutorial
Content Marketing

Trovare vecchi siti web con Wayback Machine e altri archivi online

Perché può essere utile trovare e ri­pri­sti­na­re vecchie pagine internet?

Progetto Internet Archive: vecchie pagine internet e altro

Tutorial su Wayback Machine: trovare vecchie pagine web e ar­chi­viar­le

Primo passaggio: inserire l’URL di­ret­ta­men­te

Secondo passaggio: accedere alla pagina prin­ci­pa­le di Wayback

Terzo passaggio: cercare per parole chiave

Quarto passaggio: uti­liz­za­re la timeline e gli snapshot

Quinto passaggio: ar­chi­via­re il proprio sito web (self-snapshot)

Come scaricare vecchie pagine web?

Al­ter­na­ti­va 1: trovare siti web non così vecchi con la ricerca Google

Al­ter­na­ti­va 2: accesso a siti web già ar­chi­via­ti con WebCite

Perché può essere utile trovare e ripristinare vecchie pagine internet?

Tutorial su Wayback Machine: trovare vecchie pagine web e archiviarle

Primo passaggio: inserire l’URL direttamente

Secondo passaggio: accedere alla pagina principale di Wayback

Quarto passaggio: utilizzare la timeline e gli snapshot

Quinto passaggio: archiviare il proprio sito web (self-snapshot)

Alternativa 1: trovare siti web non così vecchi con la ricerca Google

Alternativa 2: accesso a siti web già archiviati con WebCite