Existe uma maneira de baixar páginas da wikipedia programaticamente?


1

Eu gostaria de baixar algumas páginas da Wikipedia como parte de um programa. Atualmente, eu iria para as páginas em um navegador, clique em "Download como PDF" manualmente, aguarde a renderização, faça o download, renomeie-o e mova-o para o local desejado. Eu gostaria de automatizar isso fazendo o download deles no bash ou no Python. Isso é possível (sem usar o webdriver)?


1
Apenas dois links rápidos para você começar: stackoverflow.com/a/627606/935614 e mediawiki.org/wiki/API:Main_page . Ou você os deseja como PDF e não apenas o conteúdo?
Nixda

Obrigado. Eu só quero despejá-los como pdf como referência (para algo que eu possa ler mais tarde). Não preciso analisar o conteúdo.
Cat cat teto
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.