Web spider para Ubuntu


11

Estou procurando uma web spider para o Ubuntu como esta Webripper - Calluna Software . Você pode baixar um site inteiro como você pode

wget -r -m example.com

mas o recurso que estou procurando é que você pode inserir um termo de pesquisa como "Linux", que pesquisa na Web e faz o download deles. Existem programas no Ubuntu assim?

Respostas:


4

Você pode usar os Alertas do Google para criar um tipo de página de pesquisa entregue em um feed e, em seguida, usar um leitor de RSS ou o Thunderbird para lê-los.

Eu uso o Thunderbird para RSS. Não sei se existem leitores de RSS que possam exportar o feed para um simples html.



3

Você pode experimentar o http ripper .

Aqui estão alguns recursos publicados no site:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

http://29a.ch/httpripper/screenshots/2.png Captura de tela

Assista a um tutorial, do desenvolvedor do httpripper:

Link para Download:

Funcionou para mim no Ubuntu 11.10 x64


-1

Existem módulos adequados no CPAN do Perl. Você só precisa de um pouco de script perl.

Em particular, dê uma olhada no módulo WWW: Mechanize no módulo WWW: Mechanize .

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.