Quero obter todos os arquivos de um determinado site em archive.org. Os motivos podem incluir:
- o autor original não arquivou seu próprio site e agora está offline, quero fazer um cache público a partir dele
- Eu sou o autor original de um site e perdi algum conteúdo. Quero recuperá-lo
- ...
Como faço isso ?
Levando em consideração que a máquina wayback archive.org é muito especial: os links das páginas da Web não estão apontando para o próprio arquivo, mas para uma página da Web que pode não estar mais lá. O JavaScript é usado no lado do cliente para atualizar os links, mas um truque como um wget recursivo não funcionará.
gem install wayback_machine_downloader
. Execute wayback_machine_downloader com o URL base do site que você deseja recuperar como parâmetro:wayback_machine_downloader http://example.com
Mais informações: github.com/hartator/wayback_machine_downloader