Este é um complemento à resposta de @Dennis de 18:06 30 de julho de 2012. Ele certamente aborda o caso mais difícil.
No caso mais simples, em que a marca d'água é um texto simples e sem adornos, por exemplo
Smedley For Commissioner
as marcas d'água do PDF não compactadas podem ser definidas assim:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
onde 75.96
é o deslocamento horizontal e 625
o deslocamento vertical para essa instância de marca d'água em particular. (Sim, números reais e números inteiros podem ser vistos.)
Um regexp como o seguinte funcionará para todas essas marcas d'água, ignorando quaisquer variações em seu posicionamento:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Lembre-se, entretanto, de que uma variedade de operadores de PDF modificadores pode entrar em jogo com marcas d'água que têm formatação mais complicada. Tal fantasia pode transformar o que o leitor espera (espera?) Ser uma sequência contígua e facilmente pesquisada em uma confusão de sopa de letrinhas. Por exemplo,
E 1 = mc² da Smedley ™
Pode ser o produto disso:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
. . . ou muito pior, se sua marca d'água for aprimorada em cores!
Tendo observado tudo isso, também observarei que o PDFtk possui uma versão da GUI que pretende lidar com marcas d'água, considerando uma taxa de licenciamento de US $ 4. Não é caro!
Por outro lado, acho que seu site atualmente anuncia suporte completo para O / S's através Windows 8
e OS X 10.8 Mountain Lion
. Essa safra é mais de 4 anos atrás. O PDFtk pode estar desatualizado? Suspeito que não, mas não sei.