Downloader de site (cache?) Para visualizar sites offline


9

Existe uma maneira portátil de baixar ou armazenar em cache todas as páginas de um site para visualização offline? Eu tenho um voo de cross country amanhã e gostaria de poder armazenar em cache algumas páginas da web (particularmente a página de documentos python ( http://docs.python.org/ ) e a referência pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealmente, eu gostaria de um complemento do Firefox ou algo assim, mas tudo funcionará bem desde que eu possa executá-lo no Linux.


Você pode experimentar este downloader de sites offline .
Menelaos Vergis 14/03

Respostas:


15

Eu uso o HTTrack .

Permite baixar um site da Internet para um diretório local, criando recursivamente todos os diretórios, obtendo HTML, imagens e outros arquivos do servidor para o seu computador


Eu usei este no passado, boa solução gratuita.
MaQleod

1
HTTrack é o melhor para Linux e Windows e há uma lista enorme de opções para configurar o processo de download .. eu adoro isso
eslambasha

Eu também usei; agora eles também oferecem uma versão para Android.
precisa saber é

-1 Ele não cria "todos os diretórios", não obtém todas as "imagens e outros arquivos". Ele apenas obtém o que está vinculado.
barlop

6

Eu uso o wget com essas opções para espelhar um site para uso offline

wget -cmkE -np http://example.com/a/section/i/like

Onde

-m ativa as opções de espelhamento para espelhar um site localmente

-c continua um download anterior, caso já tenha baixado algumas páginas

-k converte href absoluto para apontar para locais para visualização offline

-E garante que os arquivos tenham extensão .html após o download.

-np baixa apenas objetos em / a / section / i / e não armazena em cache o site inteiro.

Por exemplo, eu queria baixar a documentação sul, mas não os ingressos sul, etc ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

Eu uso o Windows e executo o wget no cygwin, mas também há uma porta nativa do wget do Windows .

Embora, no seu caso, você possa fazer o download de documentos offline do python na seção de documentos do python


1

Experimente http://www.downthemall.net/ um plugin do Firefox. Usei-o para baixar 250 páginas de PDFs em mais de 20 arquivos separados. É extremamente poderoso. Ele tem uma sintaxe curinga / consulta que permite obter cirurgicamente apenas os arquivos que você deseja e nenhum dos irrelevantes que você não usa.


1

Algumas extensões do Firefox que eu conheço:

  • Página de recados

    ajuda a salvar páginas da Web e gerenciar facilmente coleções. Os principais recursos são leveza, velocidade, precisão e suporte multilíngue. Os principais recursos são:

    • Salvar página da Web
    • Salvar trecho de página da Web
    • Salvar site
    • Organize a coleção da mesma maneira que os Favoritos
    • Pesquisa de texto completo e pesquisa de filtragem rápida da coleção
    • Edição da página da Web coletada
    • Recurso de edição de texto / HTML semelhante às notas do Opera
  • ScrapBook Plus

    Diferença entre o ScrapBook Plus e o ScrapBook:

    • classificação mais rápida
    • importação e exportação mais rápidas
    • abra a janela para gerenciar sua coleção diretamente da barra lateral
    • simplificou o manuseio do "Combine Wizard"
    • novos recursos para "Capture Multiple URLs" (filtro para excluir links, use o título do site ou o título do link como novo título para a entrada na barra lateral, especifique o tempo de espera entre o download de 0 a 3 segundos, use UTF-8 ou ISO-8859-1 como conjunto de caracteres)
    • nova janela "Capturar" (o download precisa ser iniciado manualmente, a rolagem automática é desativada)
    • 6 marcadores no editor
  • UnMHT

    permite visualizar arquivos em formato de arquivo da web MHT (MHTML) e salvar páginas da Web completas, incluindo texto e gráficos, em um único arquivo MHT

  • Pocket (não uma extensão; um recurso interno do Firefox)

    permite salvar páginas da web e vídeos no Pocket em apenas um clique. O Pocket elimina a desordem e salva a página em uma visualização limpa e sem distrações e permite que você as acesse em qualquer lugar pelo aplicativo Pocket.

    Observe que:

    Salvar e acessar sua lista do Pocket no Firefox requer uma conexão com a Internet. A visualização offline é possível em outros dispositivos com o aplicativo Pocket.


0

Você pode baixar um site inteiro ou parte dele com o wget.

wget -r http://docs.python.org/

Verifique o manual do wget para outras opções que você pode querer passar, por exemplo, para limitar o uso da largura de banda, controlar a profundidade da recursão, configurar listas de exclusão, etc.

Outra abordagem para a navegação offline é usar um proxy de cache. Wwwoffle é um que possui muitos recursos para facilitar a retenção para navegação offline, como substituições para datas de validade especificadas pelo servidor e um recurso de pré-busca recursiva. (Eu uso o wwwoffle desde meus dias de discagem.)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.