Home GNU/LINUX Warrick: recupera siti non più disponibili o cancellati

Warrick: recupera siti non più disponibili o cancellati

15 Giugno 2009

3553

warrik

Gli utenti internet hanno diverse possibilità di accedere ad un sito non più raggiungibile o eliminato: si puo utilizzare la funzione di cache di Google o le pagine del Web Archive.
Le cache sono ottime per recuperare una singola pagina ma non sono per nulla adatte a recuperare un intero sito.

Warrick è uno script scritto in Perl che tenta il recupero di un sito da varie fonti reperibili su Internet.

Le sue fonti sono:
Archive.org
Google
Yahoo
Bing

L’installazione non è proprio elementare ma seguendo la mini guida presente sul sito anche i meno esperti riusciranno a installare e settare il programma nel modo migliore.

Si lancia il recupero di linea di comando con questa sintassi: “warrick.pl -r -wr ia -c http://ilnomedeltuosito.com/”

Per recuperare il maggior numero di pagine possibile è consigliabile far girare Warrick diverse volte anche a distanza di giorni. Le cache dei motori di ricerca infatti sono molto ‘mobili’ ed è possibile che alcune pagine (le più recenti di solito) appaiano in cache anche diversi giorni dopo la loro effettiva pubblicazione.

Oltre allo script scaricabile e installabile è possibile effettuare il processo di recupero anche attraverso il loro sito, ma visto l’elevato numero di richieste il servizio è spesso spento ed è comunque consigliabile scaricare e lanciare dal proprio pc Warrick.

Warrick è disponibile per Linux e Windows e necessita di un interprete Perl per girare. Su Windows è consigliabile installare ‘Active Perl’

Warrick: recupera siti non più disponibili o cancellati

RispondiAnnulla risposta

POST DAL PASSATO

Scaricare mp3 con Mulve il nuovo Napster

Rete Emule sotto attacco?

PrimoPDF, creare pdf gratis

Namebench per trovare il DNS più veloce per la tua connessione

Trovare o eliminare la password del bios con CmosPwd