Criar pdf do livro HTML


16

Existem alguns sites que fornecem livros como páginas HTML (por exemplo, itens legais).

O que posso usar para criar um livro em PDF a partir dessas páginas, com base na estrutura já existente?

No Windows, há o Adobe Professional (software comercial). Eu estou supondo que o Linux tem algo de graça? Uma solução envolvendo scripts seria boa para mim.

Respostas:


9

O Caliber é uma ferramenta bastante poderosa para converter coisas em e-books em vários formatos. Disponível em um Software Center perto de você!

Não se deixe enganar por sua interface de usuário menos que bonita, pois pode fazer muito.


11
O calibre também vem com uma ferramenta de linha de comando, ebook-convert. Então, com isso você poderia fazer for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; donee converteria todos os arquivos html da pasta para PDF.
Frabjous

11
Essa é uma boa ferramenta, também sou um usuário do Calibre, acho que a mais recente marcou melhorias na interface do usuário.
Sabacon

4

O jeito mais fácil? Arquivo> Imprimir no seu navegador. Selecione Imprimir em arquivo como sua impressora e ele perguntará onde você deseja. Certifique-se de marcar o PDF. Clique em "Imprimir" e ele será salvo na sua unidade em vez de realmente ser impresso.


Obrigado. Existem muitos arquivos, no entanto. Essa manobra é praticamente impossível.
Lucian Sasu

4

Htmldoc pode ser útil, veja-o aqui; http://www.htmldoc.org/ está disponível no software center, infelizmente a versão 1.8 tem um problema com arquivos codificados em unicode, mas em muitas ocasiões ainda pode ser um salvador, o problema foi corrigido na versão de desenvolvimento 1.9.

Eu costumo usar a maravilhosa extensão de página de recados aqui; http://amb.vis.ne.jp/mozilla/scrapbook/ para o Firefox capturar as páginas da web, use as ferramentas de edição do scrapbook para corrigi-las, se necessário, e use o htmldoc para converter todas as páginas em PDF.



3

Eu recomendaria o uso do OpenOffice / LibreOffice para criar o PDF. Como teste, baixei o Wget manul (tudo em uma página) e, em seguida, abri a página HTML no OponOffice e cliquei no botão "Exportar diretamente para PDF". Ele criou o PDF com um índice do índice.

No passado, descobri que essa era a maneira mais fácil de converter páginas HTML em PDF. Também permite que você faça alterações sem muito esforço.

Imagens:

  • Manual do Wget exportado para PDF usando o Open Office Manual do Wget exportado para PDF usando o Open Office

  • Opção Exportar diretamente para PDF no Open Office Opção Exportar diretamente para PDF no Open Office


alguma idéia se o livro não estiver em uma página, mas dividido em várias seções / chaptes?
Ciprian Tomoiagă

2

Na verdade, votei na solução de calibre. Mas aqui está outro que você poderia tentar. Instale o AbiWord . Ele pode fazer conversões entre os formatos que conhece na linha de comando. Para converter todos os arquivos .html em uma pasta para .pdf, você pode:

for file in *.html ; do abiword --to=pdf "$file" ; done

Para tipografia de nível superior (mas sem dúvida mais complicado), outra opção seria PrinceXML .


2

Dependendo do documento html a ser impresso, você pode obter os melhores resultados usando o pandoc . Este é um dos mais versáteis conversores de HTML para LaTeX. O arquivo .tex resultante pode ser facilmente convertido para PDF , usando xelatexou pdflatex. Muitas opções estão disponíveis se você estiver disposto a se aprofundar na sintaxe e nos pacotes do LaTeX. Isso pode não funcionar bem se as imagens incorporadas e os estilos HTML sofisticados forem preservados.


1

No google-chrome, você pode criar um arquivo pdf para um site inteiro usando uma extensão. Pessoalmente, uso a extensão Web2PDF Converter que cria um PDF com apenas um clique.

Aqui está uma captura de tela deste plug-in, fornecida pelo site da loja de extensões do Google.

insira a descrição da imagem aqui

Além disso, você pode ver um PDF criado por mim com esta ferramenta, baixando o próximo (clique direito, salvar o destino como): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (alguns navegadores como google- chrome pode permitir que você veja isso on-line).

E se você deseja editar os PDFs criados pela extensão para remover a assinatura digital colocada pela extensão na parte inferior de cada página ou para remover qualquer outra coisa, dê uma olhada no seguinte: Remover informações de texto de um PDF?

Boa sorte!

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.