O wget é uma ferramenta muito útil para baixar material na Internet rapidamente, mas posso usá-lo para baixar sites de hospedagem, como FreakShare, IFile.it Depositfiles, Uploaded, Rapidshare? Se sim, como posso fazer isso?
O wget é uma ferramenta muito útil para baixar material na Internet rapidamente, mas posso usá-lo para baixar sites de hospedagem, como FreakShare, IFile.it Depositfiles, Uploaded, Rapidshare? Se sim, como posso fazer isso?
Respostas:
Esse tipo de site tenta dificultar a não utilização de um navegador gráfico, porque se você usar o wget, todos os anúncios que pagarão pela largura de banda estarão ausentes.
Alguns sites não fazem verificações avançadas e podem ser enganados facilmente: diga ao wget para fingir que é realmente o Mozilla e que é proveniente do site de download .
wget --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' \
--referer=http://downloadsite.example.com/download-page-url
http://downloadsite.example.com/download-page-url/filename.ext`
A maioria dos sites verificados permite que você se apresse --user-agent=Mozilla
e --referer
defina o URL do arquivo que está baixando.
Em alguns sites, pode ser necessário exportar os cookies do navegador da Web e passar --load-cookies
para o wget; neste momento, o uso do wget começa a ser mais trabalhoso do que um download manual. O método final, que pode funcionar o tempo todo, mas requer alguma codificação para cada site, é usar uma estrutura de automação de navegador como Selenium ou Watir .
Consulte também Automatizando solicitações da Web usando curl?
Zippyshare
Links: stackoverflow.com/a/21100640/1533054
Este método baseia-se na resposta de Gilles . Como ele disse, o truque é fazer o servidor pensar que a solicitação está sendo feita a partir de um navegador e, para que isso aconteça, você precisa de algumas coisas:
Aqui está uma captura de tela explicando onde você pode obter cada item:
Agora abra seu terminal e use o seguinte comando (substituindo os itens necessários):
wget <download_link> \
--referer='<referrer>' \
--cookies=off --header "Cookie: JSESSIONID=<session_id>" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'
Exemplo:
wget http://www16.zippyshare.com/d/29887835/8895183/hello.txt \
--referer='http://www16.zippyshare.com/v/29887835/file.html' \
--cookies=off --header "Cookie: JSESSIONID=26458C0893BF69F88EB5743D74FE0F8C" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'
Nota: No comando, na verdade referer
não éreferrer
Eu também gostaria de obter respostas perfeitas, usei o seguinte truque para baixar um filme infantil para o meu filho do Turbobit:
Em vez de SESSION_ID da resposta acima, você precisa encontrar "compid" na guia de cookies do FIREBUG:
Depois disso, o comando para o meu sistema embarcado debian foi muito fácil:
wget --referer='http://http://turbobit.net/download/free/yilmacr4e351' --cookies=off --header "Cookie: compid=c9255510c34624435292d8a0e7e405be66aa01f9%7ED01343F87AB53A2C38D957A564DA1D55" --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' http://turbobit.net/download/redirect/B3EDACDA9B899937A149D5AAB6662327/yilmacr4e351/Ters.Yuz.2015.1080P.WEBDL.TR.EN.mkv &
Agora posso desligar meu computador :)