Se você usar a expansão entre chaves wget
, poderá buscar imagens numeradas em seqüência com facilidade:
$ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg'
Ele busca os 10 primeiros arquivos numerados 90.jpg
para 99.jpg
ficarem bem, mas 100.jpg
retorna um erro 404: Arquivo não encontrado (tenho apenas 100 imagens armazenadas no servidor). Esses arquivos inexistentes se tornam mais "um problema" se você usar um intervalo maior, como {00..200}
, com 100 arquivos inexistentes, aumenta o tempo de execução do script e pode até se tornar um pequeno fardo (ou pelo menos aborrecimento) em o servidor.
Existe alguma maneira de wget
parar depois de receber seu primeiro erro 404? (ou melhor ainda, duas em uma linha, caso haja um arquivo ausente no intervalo por outro motivo) A resposta não precisa usar a expansão entre chaves; loops também são bons.
1, 2 or even n failures
não é o caminho certo quando você conhece[begin .. end]
índices. Por que você especificaria o[1..200]
alcance quando sabe que existem apenas 100 imagens[1..100]
? Eu acho que você pode tentar o GNUparallel
para solicitações simultâneas para acelerar o processo.