Pegue todas as imagens "não incorporadas" em uma página da web


1

Estou procurando uma maneira de capturar todas as imagens de um blog, mesmo que não sejam visíveis (incorporadas) no próprio blog. Em outras palavras, imagens carregadas em uma página da web, mas ainda não incorporadas em um artigo.

Vamos que alguém tenha um blog: bestblogever.com/

E ele publicou o artigo: bestblogever.com/24/11/

Nesse artigo, existe apenas uma imagem: bestblogever.com/24/11/IMG_23.jpg

Sei que o diretório bestblogever.com/24/11/ contém mais imagens, mas não conheço os URLs. Existe uma maneira (preferencialmente) de um software que possa pesquisar e baixar todas as imagens não listadas? Por exemplo:

bestblogever.com/24/11/IMG_23.jpg

bestblogever.com/24/11/IMG_55.jpg

bestblogever.com/24/11/IMG_08.jpg

bestblogever.com/24/11/IMG_65.jpg

Eu tentei o HTTrack, mas parece apenas capturar as imagens que são realmente exibidas na página da web.


Se você pode acessar o diretório da web bestblogever.com/24/11/, seria fácil. Caso contrário, você provavelmente teria que adivinhar os URLs.
MC10 7/08

11
Isso já foi solicitado inúmeras vezes. Você não pode fazer isso, a menos que o servidor permita a indexação de diretório.
Qdddddqd

Eu poderia continuar e verificar, por exemplo, bestblogever.com/24/11/IMG_23.jpg bestblogever.com/24/11/IMG_55.jpg bestblogever.com/24/11/IMG_08.jpg bestblogever.com/24/11/IMG_65 .jpg ..manualmente. Mas eu não posso acreditar que não há nenhuma maneira de automatizar isso ..
Arete

Acho que o que estou dizendo é que, se consigo adivinhar os URLs da imagem digitando números diferentes antes do .jpg, deve ser possível para um software fazer isso.
Arete

Bem, sim, você apenas escreveria um script para fazer isso.
MC10 7/08/15

Respostas:


0

Em nosso site irmão StackOverflow, você pode ler algo semelhante a [ 1 ]

for /L %%I in (0,1,100) do (
    wget "http://download/img%%I.png"
    sleep 1
)

No Linux, você pode usar a mesma construção ou, por exemplo,

seq 0 1 100 | awk '{printf("wget http://download/img%d.png\n",$1)}'| /bin/sh

Notas:

  • Se você usar %3.3d, em vez de %dvocê obterá img000.png... img012.png... img100.png, em vez de img0.png... img12.png... img100.png.
  • Se você evitar o último pipe ( | /bin/sh), imprimirá no shell a saída gerada.
    Depois que você verificou sua exatidão, pode adicioná-lo novamente e executá-lo.
  • O \nadicionar uma nova linha para a saída. Você pode adicionar sleep 1.23 \ndepois para adicionar uma nova linha que espera 1,23 segundos entre os downloads.
  • Você pode precisar adicionar algumas opções à linha de comando wget [ 2 ] .
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.