Estou tentando fazer o download de um URL semelhante http://www.somesite.com/restaurants.html#photo=22x00085
.
Coloquei-o entre aspas simples, mas ele só baixa http://www.somesite.com/restaurants.html, que não é a página correta.
Há uma solução?
Estou tentando fazer o download de um URL semelhante http://www.somesite.com/restaurants.html#photo=22x00085
.
Coloquei-o entre aspas simples, mas ele só baixa http://www.somesite.com/restaurants.html, que não é a página correta.
Há uma solução?
Respostas:
wget
está funcionando bem. A sintaxe do URI especifica que o fragmento - a #foo
parte - deve ser interpretado inteiramente do lado do cliente e não usado ao recuperar o próprio documento.
Por exemplo, se for uma página HTML, o navegador pode rolar para uma seção nomeada ou, no seu caso, acionar algum código JavaScript que mostra uma foto específica.
Em outras palavras, no que diz wget
respeito, os URIs
http://www.somesite.com/restaurants.html#photo=22x00085
ehttp://www.somesite.com/restaurants.html
... aponte para a mesma página /restaurants.html
. Cabe ao seu navegador fazer o resto. A abertura restaurants.html#photo=22x00085
no navegador deve funcionar bem.
Sem visitar o link adequado, não sei dizer qual é, mas existem apenas duas opções:
O hash, na verdade, faz parte do nome do documento solicitado. Nesse caso, você pode codificá-lo:
No outro caso, em circunstâncias normais, http://www.somesite.com/restaurants.html e http://www.somesite.com/restaurants.html#photo=22x00085 devem apontar para a mesma página. A parte após o hash simplesmente indica a âncora para a qual o navegador deve rolar após o carregamento da página; ele nem é enviado para o servidor.
No entanto, é possível que o hash seja (ab) usado para carregar uma foto específica com JavaScript. O Wget não pode interpretar JavaScript, então não há nada que você possa fazer sobre isso.
Esse não é o URL da imagem. É o URL de uma página que usa um script ou outro código para buscar a imagem. Tente carregar a página com o JavaScript desativado. É isso que o wget está buscando para você.
Para encontrar o URL da imagem, tente visitar a página pelo navegador e clique com o botão direito do mouse na foto. Deve haver uma opção para visualizar informações sobre a imagem, incluindo seu URL.
Se isso não funcionar, pode ser porque a imagem está sendo carregada através do Flash ou de algum outro programa do lado do cliente. Você pode usar o Fiddler ou o Wireshark para ver qual URL está sendo carregado.
Se você nos fornecer o URL real do site com a imagem, podemos ajudá-lo a determinar como a imagem está sendo carregada.