HTML recursivo para PDF


12

Eu tenho uma pasta com esta estrutura:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

com muitas subpastas e apenas arquivos html ... quero converter todos eles em pdf usando apenas um comando ou um script simples que não exija todos os nomes de arquivos.

Você conhece um

Respostas:


15

Sugiro instalar a ferramenta WKHtmlToPDF em http://wkhtmltopdf.org/ (movida de: http://code.google.com/p/wkhtmltopdf/ ).

Você pode então mudar para a pasta raiz e usar find e xargs para convertê-los:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Isso criará um PDF com cada arquivo HTML.


Eu resolvi com uma lista de arquivos e uma festança para, mas isso é muito melhor!
Matteo Pagliazzi

5

O comando a seguir deve fazer o trabalho para um link:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Para vários links, não deve ser difícil escrever um loop que lida com cada link, um por um.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.