Warrick: recupera siti non più disponibili o cancellati

warrik

Gli utenti internet hanno diverse possibilità di accedere ad un sito non più raggiungibile o eliminato: si puo utilizzare la funzione di cache di Google o le pagine del Web Archive.
Le cache sono ottime per recuperare una singola pagina ma non sono per nulla adatte a recuperare un intero sito.

Warrick è uno script scritto in Perl che tenta il recupero di un sito da varie fonti reperibili su Internet.

Le sue fonti sono:
Archive.org
Google
Yahoo
Bing

L’installazione non è proprio elementare ma seguendo la mini guida presente sul sito anche i meno esperti riusciranno a installare e settare il programma nel modo migliore.

Si lancia il recupero di linea di comando con questa sintassi: “warrick.pl -r -wr ia -c http://ilnomedeltuosito.com/”

Per recuperare il maggior numero di pagine possibile è consigliabile far girare Warrick diverse volte anche a distanza di giorni. Le cache dei motori di ricerca infatti sono molto ‘mobili’ ed è possibile che alcune pagine (le più recenti di solito) appaiano in cache anche diversi giorni dopo la loro effettiva pubblicazione.

Oltre allo script scaricabile e installabile è possibile effettuare il processo di recupero anche attraverso il loro sito, ma visto l’elevato numero di richieste il servizio è spesso spento ed è comunque consigliabile scaricare e lanciare dal proprio pc Warrick.

Warrick è disponibile per Linux e Windows e necessita di un interprete Perl per girare. Su Windows è consigliabile installare ‘Active Perl’

CONDIVIDI
ARTICOLI CORRELATI
Lascia un commento

Captcha - risolvi l\'operazione per inviare il commento * Time limit is exhausted. Please reload CAPTCHA.