Existem ferramentas disponíveis para cortar margens de PDF?


44

Eu tenho um ebook que estou tentando ler em formato PDF em um Kindle. Infelizmente, os cabeçalhos e rodapés da página possuem algum conteúdo (número da página e informações sobre direitos autorais, respectivamente), impedindo que o dispositivo dimensione o texto real para corresponder à área de visualização da área utilizável, deixando o conteúdo real muito pequeno para ser lido.

Estão disponíveis várias ferramentas que cortam o espaço em branco, mas o Kindle já faz isso; meu objetivo, por outro lado, é remover o material impresso fora de uma caixa delimitadora definida, e a única ferramenta que encontrei para esse fim é um software comercial moderadamente caro.

Provavelmente eu poderia gerar uma máscara no Inkscape; divida as páginas individuais usando o pdftk, aplique a máscara a cada página individualmente (saída para postscript) e recombine os vários arquivos postscript em um único PDF. No entanto, essas etapas de decodificação / recodificação seriam bastante infelizes em termos de tamanho do documento; algo capaz de operar com um pouco mais de elegância seria o ideal.

Eu tenho todos os principais sistemas operacionais à mão (Windows, várias distribuições modernas de Linux, Mac, etc) para que as soluções não precisem ser restringidas pela plataforma.

Sugestões?

(Eu relatei o problema ao autor, que o mencionou ao editor, que não fez nada sobre o assunto ao longo de mais de um mês, tornando a abordagem de trabalho zero evidentemente improdutiva).

Respostas:


45

Experimente o BRISS . Livre, de código aberto e multiplataforma. Há uma boa discussão sobre isso nos fóruns do MobileRead .


4
Essa é uma bela peça de software; obrigado!
Charles Duffy

1
Irreal! ótimo programa
Fidel

PDF aberto, ele selecionou automaticamente a área a ser cortada, salva em um novo arquivo com a adição de _cropped ao nome do arquivo, basicamente eu não fiz nada - aplicativo incrível!
Rush Frisby

Essa ferramenta preserva todos os gráficos vetoriais em PDF ==> O zoom funciona como antes do corte. Exatamente o que eu precisava.
kiltek 13/11/2015

1
Briss é excelente na medida em que trabalha automaticamente e quase sempre faz um bom trabalho. Em máquinas Linux, você pode obter o resultado com um comando curto em alguns segundos com "briss myfile.pdf". Basta adicionar a seguinte linha ao seu arquivo ~ / .bashrc, adaptando-o ao diretório de instalação do briss: briss () {java -jar ~ / bin / briss-0.9 / briss-0.9.jar -s "$ 1"; }
dominecf

10

Como mencionado em outra resposta, o BRISS é ótimo. Outra ferramenta realmente útil é o k2pdfopt ( http://www.willus.com/k2pdfopt/ ). Essa ferramenta é realmente ótima para pegar um pdf e otimizá-lo para o Kindle (ou qualquer dispositivo com tela menor). Ele funciona muito bem no papel científico de 2 colunas, pois reflete o texto enquanto mantém a equação e as imagens.


4

Como já foi apontado, o k2pdfopt é uma ótima ferramenta.

Se você não se importa de fazer o jailbreak do seu Kindle (e possivelmente de anular a garantia), também existe a opção de usar essa ferramenta diretamente no seu leitor. Isso é implementado por três garfos do mesmo pacote de software:

Eles lidam com várias colunas, permitem refluxo de texto e alteração do tamanho da fonte. Eles até conseguem não destruir fórmulas e imagens científicas quando refletem.

Atualmente, existem problemas menores, como a falta de espaços entre duas palavras de um salto de linha, mas eu os considero sem problemas. Talvez eles sejam corrigidos em uma das próximas versões.


3

Você pode usar o ScanTailor para uma ferramenta mais poderosa. Essa ferramenta não apenas corta automaticamente as margens, mas também pode adicionar mais (caso alguém chegue a essa pergunta para a última). Abaixo está o conteúdo de sua página wiki Layout da página :


Nesta fase, você pode ajustar as margens adicionadas à caixa de conteúdo. Existem dois tipos de margens - rígidas e flexíveis.

Margem forte - é aquela entre as linhas sólidas. Eles são definidos pelo usuário. Você pode mover-se sobre qualquer linha sólida, seja uma aresta interna ou externa, ou definir as margens através de valores numéricos.

Margem suave - é aquela entre o sólido e a linha pontilhada. Essas margens são adicionadas automaticamente para trazer o tamanho da página para o mesmo tamanho de outras páginas. Se você vir uma linha pontilhada - isso significa que em algum lugar do projeto há uma página com essa largura (área útil da margem Hard +) e (possivelmente outras) com essa altura.

Essa é uma página grande que causa margens suaves em todas as outras páginas, mesmo que não seja nivelada.

O alinhamento opcional é definido com precisão, adicione uma margem flexível e, se você adicionar, com qualquer uma das peças.


Ele não parece trabalho para arquivos PDF
Oleksiy

Bem, sim, você deve exportá-lo para imagens primeiro #
Ooker

E depois converta-os novamente em PDF. Isso é um exagero, especialmente para PDFs com centenas de páginas, como livros e livros didáticos.
`` #

@Oleksiy bem, exagero ou não depende de sua necessidade, afinal. Se você só precisa do Bloco de Notas, certamente o Word é um exagero. Mas algumas pessoas percebem que o Bloco de Notas não é bom o suficiente para elas. É por causa de ter que lidar com livros e livros que eu preciso esta ferramenta
Ooker

1

Eu também tive esse problema com meu PDF de 1200 páginas digitalizado (não em inglês). Todas as ferramentas, incluindo o Adobe Acrobat (IX a XI), falharam ao aparar o espaço em branco ao redor. A margem da página ímpar diferia daquela nas páginas pares. Para piorar, o tamanho da margem era inconsistente. Como @frabjous apontou, Briss ajudou. No entanto, quando todas as páginas do documento foram sobrepostas, observou-se que um corte não pode ser aplicado, pois não havia espaço em branco efetivo geral (devido a margens inconsistentes)

A única solução foi então dividir o documento PDF em páginas individuais, executá-lo no Briss para remover margens e recombinar. Os passos que segui são:

  1. Dividi este documento em páginas individuais com o Adobe Acrobat IX clicando em Document->Split documentque abriu a seguinte caixa de diálogo: insira a descrição da imagem aqui Esta ação criou 1200 arquivos PDF individuais.
  2. Então eu criei um arquivo em lotes com o seguinte conteúdo:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Coloque esse arquivo em lote no mesmo local em que os arquivos PDF 1200 são colocados e executou o arquivo em lote.
  4. Mais uma vez, usei o Adobe Acrobat IX para juntar todos os arquivos PDF em um único arquivo e pronto, eu tinha um PDF com todas as suas páginas com margens brancas mínimas que agora eram fáceis de ler no tablet.

Dica: No conteúdo acima mencionado do arquivo em lotes, eu basicamente corro um FORloop e pego cada arquivo PDF e o passo para o Briss para cortar automaticamente o PDF. Dependendo

  1. onde o Briss está instalado (e arquitetura do computador, por exemplo, x86 ou x64).
  2. onde o Java Run Time Environment está instalado.
  3. O ambiente de tempo de execução Java pode ser baixado gratuitamente a partir daqui

1

Ler PDFs em um Kindle não é o ideal. Uma maneira ideal é converter os arquivos PDF em um formato que o Kindle reconhecerá usando o MobiCreator para converter arquivos PDF em arquivos .prc para o Amazon Kindle.

1. Baixe e instale a versão COMPLETA do Mobipocket Creator no link abaixo. (Se você optar pela versão mais simples, ela não terá a opção de conversão de PDF.)

http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN

2. Quando o Mobipocket Creator estiver em execução, selecione Adobe PDF em Importar do arquivo existente

3. Escolha o arquivo PDF que deseja converter

4. Deixe o resto em paz, a menos que você queira alterar sua pasta de destino e clique em Importar

5. Selecione o arquivo html que acabou de ser criado e clique em Build na barra de ferramentas na parte superior do Mobipocket Creator

6. Clique em Build (você provavelmente obterá alguns erros, mas eu os ignoro)

7. Vá para a pasta de destino, abra a pasta que foi criada com sua publicação

8. Copie o arquivo .prc na pasta Documents do seu Kindle através do cabo USB (se você quiser entregá-lo sem fio, precisará enviá-lo por e-mail e pagar 10 centavos)

Uma das principais dificuldades de ler arquivos PDF no Kindle é a falta de um índice, para que você não possa pular com muita facilidade.

No entanto, existe uma função no Mobipocket Creator para criar um Sumário.


O dispositivo é realmente um Kindle DX; ele não tem um built-in leitor de PDF, e é suficientemente grande formato que meus documentos são muito bem com suas margens aparadas.
Charles Duffy

@CharlesDuffy Fine, menos problemas então. Thx para me informar, esperava que funcionou
Simon
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.