Vi possono essere diverse situazioni in cui è comodo avere una copia uno a uno di uno o più siti in locale: dovete fare un viaggio e non avrete connessione e però non volete perdervi le notizie del vostro blog preferito e volete navigarlo offline con tutta calma, avete bisogno di una copia precisa del vostro sito sul vostro disco, oppure solo verificare l’integrità dei link all’interno del vostro sito.

Per compiere questa operazione esiste HTTrack un progetto opensource e multipiattaforma che permette di scaricare interi siti in locale a partire da un determinato indirizzo.

Ovviamente sono numerose le opzioni del programma per limitare o estendere il mirroring del sito/dei siti, ed è anche disponibile un sistema di filtri per un ulteriore controllo del tipo e delle caratteristiche dei file da scaricare in locale.

Fate molta attenzione a specificare la profondità alla quale volete arrivare onde evitare di scaricare parti e sezioni del sito che non vi interessano.

Sono supportati i protocolli HTTP e FTP ma non HTTPS.

All’interno delle pagine scaricate, i link sono riorganizzati, in modo da rendere possibile l’accesso offline a tutti i file.
Alla fine del processo (che può risultare molto lungo) avrete quindi una directory (da voi specificata all’inizio del processo) con un file index da cui potrete iniziare la navigazione completa del sito.

ht

Per evitare di sovraccaricare il server remoto dal quale state scaricando il sito è consigliabile anche settare il massimo numero di connessioni contemporanee.

HTTrack è disponibile per Linux, OSX e Windows tutte le versioni. E’ disponibile in versione a riga di comando e anche senza installer (comodo ad esempio da installare su chiavetta USB)

La homepage del progetto e i download li trovate qui

4 Commenti

  1. E’ inteso come ‘settare’ il n° massimo di connessioni in modo da non appesantire il server target. Grazie comnunque della segnalazione :)

  2. credo ci sia un refuso:

    “Per evitare di sovraccaricare il server remoto dal quale state scaricando il sito è consigliabile anche settare il massimo numero di connessioni contemporanee”

    semmai è vero il contrario °_°