Scaricare in locale un intero sito con HTTrack

Vi possono essere diverse situazioni in cui è comodo avere una copia uno a uno di uno o più siti in locale: dovete fare un viaggio e non avrete connessione e però non volete perdervi le notizie del vostro blog preferito e volete navigarlo offline con tutta calma, avete bisogno di una copia precisa del vostro sito sul vostro disco, oppure solo verificare l’integrità dei link all’interno del vostro sito.

Per compiere questa operazione esiste HTTrack un progetto opensource e multipiattaforma che permette di scaricare interi siti in locale a partire da un determinato indirizzo.

Ovviamente sono numerose le opzioni del programma per limitare o estendere il mirroring del sito/dei siti, ed è anche disponibile un sistema di filtri per un ulteriore controllo del tipo e delle caratteristiche dei file da scaricare in locale.

Fate molta attenzione a specificare la profondità alla quale volete arrivare onde evitare di scaricare parti e sezioni del sito che non vi interessano.

Sono supportati i protocolli HTTP e FTP ma non HTTPS.

All’interno delle pagine scaricate, i link sono riorganizzati, in modo da rendere possibile l’accesso offline a tutti i file.
Alla fine del processo (che può risultare molto lungo) avrete quindi una directory (da voi specificata all’inizio del processo) con un file index da cui potrete iniziare la navigazione completa del sito.

ht

Per evitare di sovraccaricare il server remoto dal quale state scaricando il sito è consigliabile anche settare il massimo numero di connessioni contemporanee.

HTTrack è disponibile per Linux, OSX e Windows tutte le versioni. E’ disponibile in versione a riga di comando e anche senza installer (comodo ad esempio da installare su chiavetta USB)

La homepage del progetto e i download li trovate qui

CONDIVIDI
ARTICOLI CORRELATI
4 commenti a “Scaricare in locale un intero sito con HTTrack”

Ottimo, finalmente potrò migrare il mio blog su…ehm dove? :(

Inviato da Fabrizio Ferrara il 15 settembre 2010 alle 19:59

credo ci sia un refuso:

“Per evitare di sovraccaricare il server remoto dal quale state scaricando il sito è consigliabile anche settare il massimo numero di connessioni contemporanee”

semmai è vero il contrario °_°

Inviato da jenova il 16 settembre 2010 alle 11:23

E’ inteso come ‘settare’ il n° massimo di connessioni in modo da non appesantire il server target. Grazie comnunque della segnalazione :)

Inviato da MAMBRO il 16 settembre 2010 alle 11:26

Ed a quanto andrebbe settato il numero di connessioni massime?

Inviato da Fabrizio Ferrara il 16 settembre 2010 alle 11:32
Lascia un commento

Captcha - risolvi l\'operazione per inviare il commento * Time limit is exhausted. Please reload CAPTCHA.