Come scaricare un sito da archive.org

Il sito di un progetto a cui ho collaborato, progettosipario.org, ha smesso di funzionare l’estate scorsa, e a me piace aver traccia del lavoro svolto. Per cui ho comprato il dominio progettosipario.it con l’intenzione di ripubblicare il contenuto del sito, che fortunatamente è salvato su web.archive.org.

L’unico strumento in grado di scaricare un intero sito è il wayback-machine-downloader di hartartor, che è uno script ruby. Recentemente archive.org ha dovuto introdurre un limite al quantitativo di file scaricabili, per cui bisogna aggiungere delle attese nello script, come spiegato in questa issue: https://github.com/hartator/wayback-machine-downloader/issues/273

A questo punto ho ottenuto 189 file, solo che, come spesso accade con i siti WordPress, i link erano tutti assoluti, cioè il link dalla home alla about puntava sempre alla about di progettosipario.org, e quindi non funzionava. Ho perso tempo con uno script perl trovato su perlmonks che avrebbe dovuto fare esattamente quello che mi serviva, risolvendo anche un problema di dipendenze, causato dalla sostituzione dei tab con gli spazi mentre scaricavo lo script.

Alla fine l’ho risolta in modo molto più semplice, in Visual Studio Code ho aperto la cartella contenente l’intera struttura del sito, e ho fatto un cerca e sostituisci, da progettosipario.org a progettosipario.it.

Poi ho caricato tutto sul server via FTP, il problema è che ci avevo già installato Omeka S, e adesso funziona solo specificando esattamente l’URL del file, non della cartella come dovrebbe. Non sembrano esistere istruzioni su come disinstallare Omeka S.