Como remover uma marca d'água de um arquivo PDF?


41

Eu pensei que isso seria uma tarefa simples, mas acabou de outra maneira.

A marca d'água é a mesma imagem (sobreposta, mas transparente) em todas as páginas. Eu mesmo criei o arquivo PDF (portanto, não se preocupe com direitos autorais) usando o PDFCreator 0.9.8.

Já experimentei o Adobe Acrobat Pro do meu amigo, mas não funcionou. Ele tenta removê-lo, mas não pode. Tentei remover o cabeçalho / rodapé etc., mas a marca d'água não desapareceu.

Como posso remover a marca d'água?


2
PDF é um formato de saída, como uma página impressa eletrônica. Ele não deve ser editado e, na maioria dos casos, você não poderá fazer o que está pedindo, exportando as páginas para imagens e fazendo photoshop nas marcas d'água.
Mk12 30/07/12

As recomendações de compras estão fora do tópico para todos os sites de troca de pilhas. Para evitar que essa pergunta seja encerrada, eu recomendaria alterá-la para uma pergunta de como, em vez de qual pergunta
Canadian Luke REINSTATE MONICA

3
Parece que você simplesmente usaria o PDFCreator 0.9.8 e definiria a opção para que uma marca d'água NÃO seja adicionada a cada página. Suponho que essa pergunta seja porque você não tem a fonte original.
Ramhound 31/07

Respostas:


73

Para marcas d'água com base em imagem, existem várias ferramentas que prometem sua remoção automática. Por exemplo:

Tudo isso é livre para experimentar, mas exige uma licença para realmente produzir a saída desejada.

No entanto, a marca d'água desse arquivo PDF específico (que o OP me enviou por email) não é uma imagem única que se repete em todas as páginas. Acontece que o PDFCreator o codificou (quase pixel por pixel) em cada um deles. Isso torna a marca d'água muito mais difícil de remover (e resulta em um arquivo PDF bastante inchado).

Como a marca d'água é realmente composta de muitas imagens minúsculas, você pode removê-las com um editor de PDF (por exemplo, Foxit Advanced PDF Editor ), simplesmente selecionando-as e pressionando Delete. Infelizmente, você deve repetir isso para todas as páginas.

Uma solução menos demorada seria remover a marca d'água programaticamente. Nós precisamos:

Passos

  1. Baixar pdftk e extrair pdftk.exe e libiconv2.dll para % windir% \ System32 , um diretório no caminho ou qualquer outro local de sua escolha.

  2. Baixe e instale o Notepad ++.

  3. Os fluxos de PDF geralmente são compactados usando o algoritmo DEFLATE . Isso economiza espaço, mas torna ilegível a fonte do PDF.

    O comando

    pdftk original.pdf output uncompressed.pdf uncompress
    

    descompacta todos os fluxos, para que possam ser modificados por um editor de texto.

  4. Abra uncompressed.pdf com o Notepad ++ para revelar a estrutura da marca d'água.

    Nesse caso específico, toda página começa com o bloco

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    e quase 4.000 blocos como este. Esse bloco específico define apenas um ( /W 1 /H 1) dos pixels da marca d'água.

    Rolar para baixo até que o padrão seja alterado revela que o fluxo da marca d'água tem 95.906 bytes de comprimento (contando novas linhas). O mesmo fluxo exato é repetido em todas as páginas do arquivo PDF.

  5. Pressione Ctrl+ He defina o seguinte:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    A expressão regular q 9 0 0 9 2997 4118\.67 cm.{95881}corresponde à primeira linha do bloco acima ( q 9 0 0 9 2997 4118.67 cm) e todos os seguintes 95.881 caracteres, ou seja, o fluxo da marca d'água.

    Clicar em Substituir tudo o remove de todas as páginas do arquivo PDF.

  6. A marca d'água foi removida, mas o arquivo PDF possui erros (os comprimentos dos fluxos estão incorretos) e não está compactado.

    O comando

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    cuida de ambos.

  7. não compactado.pdf não é mais necessário. Você pode excluí-lo.

O resultado é o mesmo PDF sem a marca d'água (e cerca da metade do tamanho).


4
Outro truque que achei útil: foi difícil para mim descobrir o bloco correspondente à marca d'água no meu PDF. Então, o que eu fiz foi extrair apenas uma única página do PDF, idealmente uma página em que haja apenas a marca d'água e não muito mais. Somente nesta página, deve ser mais fácil descobrir o bloco que corresponde à marca d'água. Depois, volte e faça isso para o PDF original.
11115 Kenny LJ

1
Uau, este é o primeiro lugar na internet que encontrei uma boa maneira de gerenciar isso. Algum lugar que você recomenda ler no formato do contêiner?
ConstantineK

2
@hobs IIRC, li partes da referência oficial em PDF para escrever esta resposta.
Dennis

1
Obrigado @Dennis, eu já te dei um voto positivo, mas esta parece ser a melhor fonte canônica. Consegui fazer o que precisava com apenas algumas localizações / substituições e algumas tentativas e tentativas de compressão adicionais. ENORME AJUDA!
ConstantineK

7
Em vez de pdftkvocê também pode usar qpdf para descompactar e compactar os arquivos pdf. Comandos: qpdf --stream-data=uncompress original.pdf uncompressed.pdfeqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler

6

Parece que a marca d'água é realmente parte das imagens dentro do arquivo .PDF, e não uma imagem separada renderizada sobre ele pelo que você estiver usando para exibir o arquivo .PDF. Talvez você não consiga remover a marca d'água sem extrair as imagens do arquivo .PDF, executando-as por meio de um editor de imagens e reconstruindo o arquivo .PDF manualmente.


4

Para marcas d'água de texto, editar uma versão PostScript pode ser muito mais fácil: Depois

$ pdftops document.pdf

edite document.ps e depois converta novamente para PDF via

$ ps2pdf document.ps


No Linux, cuidado que pdftopse pdf2pssão diferentes. Use o primeiro comando, não o segundo.
Camille Goudeseune 8/08

1
Se você souber qual é o texto da marca d'água, aqui está uma lista. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune 8/08

1

Os artefatos do carimbo são que você pode excluí-lo no Adobe Acrobat Pro; no entanto, ele é regenerado com a movimentação do mouse, porque o objeto de fluxo o mantém persistente.

Se você tentar editar a fonte pdf - o que é complicado, há uma chance de que o arquivo seja corrompido.

Se o carimbo for um fluxo, podemos interrompê-lo desconectando o computador da rede, o que fiz.

Em seguida, usando o Adobe Acrobat Pro, selecionei uma das minhas anotações, cliquei com o botão direito do mouse para obter o pop-up e selecione "Mostrar lista de comentários".

Selecione a marca d'água / carimbo nefasto na lista, clique com o botão direito do mouse para obter o pop-up e selecione "Excluir". Faça isso em todas as páginas em que a afixação ocorre.

Salve o arquivo com outro nome. Meu aplicativo travou, mas não antes de salvar o arquivo!

Abra o novo arquivo e muito menor; observe que todas as marcas d'água / carimbos são gonzo.

No meu caso, o tamanho do arquivo do meu documento de 3 páginas diminuiu de 300 kb para impressionantes 60 kb. Todos os dados e anotações originais permaneceram intactos - sem as marcas d'água.

~ Boa caça: o)


1

converta o documento em arquivo .rtf usando o zamzar. A marca d'água desaparece automaticamente após a conversão. Nota: - Funciona perfeitamente se o documento contiver material de texto. Sempre foi de grande ajuda .. (usuário de Mac)


Isso não funciona para o PDF que eu tentei.
Kenny LJ

1

Encontrou outra maneira de fazer isso:

  1. Use a ferramenta pdf2htmlEX (ou qualquer outro conversor de PDF para HTML) para converter o PDF em um arquivo HTML.
  2. Edite HTML com um editor de texto e remova a marca d'água. Salve isso.
  3. Imprimir no HTML em um novo documento PDF
  4. Lucro

Obrigado. Tem certeza de que não foi possível remover a marca d'água com o Adobe Acrobat dessa maneira? (Este pode ser de fato uma solução mais barata.)
Apache

Acredito que você precise de algum tipo de senha para remover a marca d'água no Adobe Reader, portanto, usei esse método.
Dominik Antal

0

Este é um complemento à resposta de @Dennis de 18:06 30 de julho de 2012. Ele certamente aborda o caso mais difícil.

No caso mais simples, em que a marca d'água é um texto simples e sem adornos, por exemplo

Smedley For Commissioner

as marcas d'água do PDF não compactadas podem ser definidas assim:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

onde 75.96é o deslocamento horizontal e 625o deslocamento vertical para essa instância de marca d'água em particular. (Sim, números reais e números inteiros podem ser vistos.)

Um regexp como o seguinte funcionará para todas essas marcas d'água, ignorando quaisquer variações em seu posicionamento:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Lembre-se, entretanto, de que uma variedade de operadores de PDF modificadores pode entrar em jogo com marcas d'água que têm formatação mais complicada. Tal fantasia pode transformar o que o leitor espera (espera?) Ser uma sequência contígua e facilmente pesquisada em uma confusão de sopa de letrinhas. Por exemplo,

E 1 = mc² da Smedley ™

Pode ser o produto disso:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . ou muito pior, se sua marca d'água for aprimorada em cores!

Tendo observado tudo isso, também observarei que o PDFtk possui uma versão da GUI que pretende lidar com marcas d'água, considerando uma taxa de licenciamento de US $ 4. Não é caro!

Por outro lado, acho que seu site atualmente anuncia suporte completo para O / S's através Windows 8e OS X 10.8 Mountain Lion. Essa safra é mais de 4 anos atrás. O PDFtk pode estar desatualizado? Suspeito que não, mas não sei.


Obrigado pela recomendação do PDFtk, parece legal, mas sim também "cheira" um pouco desatualizado. A versão gratuita é 2.02, e a Wikipedia diz que foi lançada há 3 anos: en.wikipedia.org/wiki/PDFtk
Apache

1
@Shiki - na verdade, fiz uma pesquisa séria sobre os formatos PDF, mas refiz minha avaliação detalhada do progresso do PDF nos últimos dez anos. Aqui está o resumo: "Déficits de uma versão PDFtk de 3 anos à luz do desenvolvimento das especificações do PDF". Embora tenha havido várias atualizações desde, digamos, 2005, você ficará bem com _PDFtk_ com toda a probabilidade._ Digo isso depois de verificar algumas fontes modernas e comuns de documentos em PDF. Todos os documentos em PDF que verifiquei foram criados para os padrões de PDF anteriores a 2010 ( bem antes, na verdade). Se você tiver alguma dúvida, verifique as dezenas de bytes principais do arquivo PDF em questão.
Der Schley

0

Aqui estão maneiras gratuitas e pagas de fazer isso, sugiro que você use o Google Drive.

O Google Drive pode abrir arquivos e fazer pequenas edições. Além disso, ele pode ser usado para remover a marca d'água do PDF online.

  1. Abra sua conta do Google Drive, que é basicamente a mesma da sua conta do Gmail.
  2. Clique em "Novo"> "Upload de arquivo", selecione um documento PDF e faça o upload.
  3. Depois de concluído, você pode verificar o arquivo enviado no seu Drive e clicar com o botão direito do mouse para abri-lo com o “Google Docs”.
  4. Depois, sua marca d'água será removida automaticamente. Para salvá-lo, vá para “Arquivo” e clique em “Baixar como” e depois escolha “Documento PDF”.
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.