A biblioteca pdf2image pode ser usada.
Você pode instalá-lo simplesmente usando,
pip install pdf2image
Depois de instalado, você pode usar o seguinte código para obter imagens.
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
Salvando páginas em formato jpeg
for page in pages:
page.save('out.jpg', 'JPEG')
Edit: o repositório Github pdf2image também menciona que usa pdftoppm
e que requer outras instalações:
pdftoppm é o software que faz a mágica real. Ele é distribuído como parte de um pacote maior chamado poppler . Os usuários do Windows terão que instalar o poppler para Windows . Os usuários de Mac terão que instalar o poppler para Mac . Os usuários do Linux terão o pdftoppm pré-instalado com a distro (testado no Ubuntu e Archlinux) se não estiver, execute sudo apt install poppler-utils
.
Você pode instalar a versão mais recente no Windows usando o anaconda, fazendo:
conda install -c conda-forge poppler
observação: versões do Windows até 0,67 estão disponíveis em http://blog.alivate.com.au/poppler-windows/, mas observe que 0,68 foi lançado em agosto de 2018, portanto, você não receberá os recursos ou correções de bugs mais recentes.