Home GNU/LINUX Warrick: recupera siti non più disponibili o cancellati

Warrick: recupera siti non più disponibili o cancellati

15 Giugno 2009

4089

warrik

Gli utenti internet hanno diverse possibilità di accedere ad un sito non più raggiungibile o eliminato: si puo utilizzare la funzione di cache di Google o le pagine del Web Archive.
Le cache sono ottime per recuperare una singola pagina ma non sono per nulla adatte a recuperare un intero sito.

Warrick è uno script scritto in Perl che tenta il recupero di un sito da varie fonti reperibili su Internet.

Le sue fonti sono:
Archive.org
Google
Yahoo
Bing

L’installazione non è proprio elementare ma seguendo la mini guida presente sul sito anche i meno esperti riusciranno a installare e settare il programma nel modo migliore.

Si lancia il recupero di linea di comando con questa sintassi: “warrick.pl -r -wr ia -c http://ilnomedeltuosito.com/”

Per recuperare il maggior numero di pagine possibile è consigliabile far girare Warrick diverse volte anche a distanza di giorni. Le cache dei motori di ricerca infatti sono molto ‘mobili’ ed è possibile che alcune pagine (le più recenti di solito) appaiano in cache anche diversi giorni dopo la loro effettiva pubblicazione.

Oltre allo script scaricabile e installabile è possibile effettuare il processo di recupero anche attraverso il loro sito, ma visto l’elevato numero di richieste il servizio è spesso spento ed è comunque consigliabile scaricare e lanciare dal proprio pc Warrick.

Warrick è disponibile per Linux e Windows e necessita di un interprete Perl per girare. Su Windows è consigliabile installare ‘Active Perl’

Warrick: recupera siti non più disponibili o cancellati

RispondiAnnulla risposta

POST DAL PASSATO

Easy Thumbnails: resize di immagini veloce e automatico

PhotoSwipe ottima image gallery per tutti i dispositivi mobili

Microsoft Virtual Earth 3D

Download emoticon gratuiti

Jailbreak iOS 6. Musclenerd già all’opera