Se eu tiver um arquivo .txt que contenha uma lista de URLs, como posso abrir o Chrome ou Firefox, um URL por guia e salvar a página em cada guia separadamente?
Qualquer plataforma serve: Windows, Mac, Linux.
Se eu tiver um arquivo .txt que contenha uma lista de URLs, como posso abrir o Chrome ou Firefox, um URL por guia e salvar a página em cada guia separadamente?
Qualquer plataforma serve: Windows, Mac, Linux.
Respostas:
Embora a pergunta mencione especificamente o Chrome e o Firefox, se o que você está tentando fazer é salvar o conteúdo de cada página, o wget é feito para esta tarefa. Por exemplo:
wget --input-file=list_of_urls.txt
Você pode até especificar um agente de usuário específico caso queira que o servidor veja a solicitação como um determinado navegador:
wget --user-agent=some_specific_user_agent_string --input-file=list_of_urls.txt
Respondendo à minha própria pergunta, não tinha certeza de alguns plug-ins que já tinha visto, mas um olhar mais atento confirmou que eles deveriam fazer o trabalho.
Duas etapas:
1) Execute o Firefox ou Chrome na linha de comando, passando a lista de sites como parâmetro ou um arquivo contendo uma lista, usando um dos seguintes métodos:
2) Em seguida, use um dos seguintes plug-ins conforme apropriado para salvar todo o conteúdo de cada guia
Raposa de fogo:
https://addons.mozilla.org/en-US/firefox/addon/unmht/
Citado na página do plug-in (recursos específicos de interesse para esta pergunta):
Sobre este complemento: O UnMHT fornece os seguintes recursos:
- Salve a página da Web como arquivo MHT.
- Insira o URL da página da web e a data que você salvou no arquivo MHT salvo.
- Salve várias guias como arquivos MHT de uma só vez.
- Salve várias guias em um único arquivo MHT.
- Salve a página da Web com um único clique no diretório pré-especificado com o recurso Quick Save.
- Converta arquivos HTML e diretório que contém arquivos usados pelo HTML em arquivo MHT.
- Veja o arquivo MHT salvo pelo UnMHT, IE, PowerPoint, etc.
Chrome: Extensão: ZipTabs https://chrome.google.com/webstore/detail/ziptabs/ccnanbffbfbcgfmmkgejodommhidpjba
Na página de extensão:
- salve várias páginas abertas em um arquivo zip contendo arquivos HTML únicos com todos os recursos incluídos (imagens, folhas de estilo, molduras ...)
- abra um arquivo zip contendo arquivos nas guias Notas:
- esta extensão precisa que o "SingleFile Core" já esteja instalado (siga as instruções de instalação)