Por que não consigo baixar arquivos deste servidor com o wget?


0

Estou tentando baixar vários arquivos deste servidor:

http://jaspar.genereg.net/html/DOWNLOAD/ARCHIVE/JASPAR2010/jaspar_CORE/non_redundant/all_species/FlatFileDir/

Essencialmente, eu quero obter todos os arquivos * .pfm com o wget, mas ele apenas exibe uma mensagem de erro dizendo:

--2017-02-01 15:12:54--  http://jaspar.genereg.net/html/DOWNLOAD/ARCHIVE/JASPAR2010/jaspar_CORE/non_redundant/all_species/FlatFileDir/

    Connecting to jaspar.genereg.net (jaspar.genereg.net)|193.60.222.202|:80... connected.
    HTTP request sent, awaiting response... Read error (Connection reset by peer) in headers.
    Retrying.

Eu tentei "normal" wgetewget -r -A pfm

Eu realmente não tenho idéia de qual é o problema.

Quando eu especifico os arquivos diretamente:

wget http://jaspar.genereg.net/html/DOWNLOAD/ARCHIVE/JASPAR2010/jaspar_CORE/non_redundant/all_species/FlatFileDir/MA0001.1.pfm 

Funciona bem. Agradecemos antecipadamente por qualquer ajuda que você pode oferecer !


11
Você está ciente de que, no máximo, você obteria a listagem de diretórios dessa maneira? Certo? Você pode tentar especificar um agente do usuário diferente, o servidor pode estar filtrando o agente do usuário.
Seth

Você tentou wget -dobter mais informações sobre o que é enviado e recebido?
Toby Speight 02/02

Respostas:


1

Alternar useragent:

wget -r -l1 -U "Mozilla/5.0 (X11; Linux i686 (x86_64)) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.75 Safari/537.36" http://jaspar.genereg.net/html/DOWNLOAD/ARCHIVE/JASPAR2010/jaspar_CORE/non_redundant/all_species/FlatFileDir/
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.