Perguntas com a marcação «web-crawler»

5
Converta páginas da web em um arquivo para ebook
Quero baixar HTMLs (exemplo: http://www.brpreiss.com/books/opus6/ ) e associá- lo a um HTML ou outro formato que eu possa usar no leitor de e-books. Os sites com livros gratuitos não têm paginação padrão, não são blogs ou fóruns; portanto, não sabem como rastrear e mesclar automaticamente.



4
Usando o Wget para rastrear recursivamente um site e baixar imagens
Como você instrui o wget a rastrear recursivamente um site e fazer o download apenas de certos tipos de imagens? Tentei usar isso para rastrear um site e baixar apenas imagens JPEG: wget --no-parent --wait=10 --limit-rate=100K --recursive --accept=jpg,jpeg --no-directories http://somedomain/images/page1.html No entanto, embora o page1.html contenha centenas de links para …


0
Acesso a todos os links em um domínio (sem hiperlink disponível)
Eu preciso ter acesso a todos os links como: http://www.thewebsitename.com/random_alphanumeric_code1.asp http://www.thewebsitename.com/random_alphanumeric_code2.asp etc.para um determinado site: http://www.thewebsitename.com (Obviamente, nenhum link para esses links está disponível em http://www.thewebsitename.com ) O site não restringe o acesso aos links que eu quero, pois eles publicam anúncios na Internet com links para esses links. Eu …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.