Os últimos lançamentos do Ghostscript também podem fazer isso. Basta adicionar o parâmetro -dFILTERIMAGE
ao seu comando.
Existem ainda mais dois novos parâmetros que podem ser adicionados para remover seletivamente os tipos de conteúdo "vetor" e "texto" :
-dFILTERIMAGE
: produz uma saída em que todas as imagens rasterizadas são removidas.
-dFILTERTEXT
: produz uma saída em que todos os elementos de texto são removidos.
-dFILTERVECTOR
: produz uma saída em que todos os desenhos vetoriais são removidos.
Quaisquer duas dessas opções podem ser combinadas. (Se você combinar todos os três, todas as páginas serão apagadas ...)
Exemplos
Aqui está a captura de tela de uma página PDF de exemplo que contém todos os três tipos de conteúdo mencionados acima:
Captura de tela da página PDF original contendo os elementos "imagem", "vetor" e "texto".
A execução dos 6 comandos a seguir criará todas as 6 variações possíveis do conteúdo restante:
gs -o noIMG.pdf -sDEVICE = pdfwrite -dFILTERIMAGE input.pdf
gs -o noTXT.pdf -sDEVICE = pdfwrite -dFILTERTEXT input.pdf
gs -o noVCT.pdf -sDEVICE = pdfwrite -dFILTERVECTOR input.pdf
gs -o onlyIMG.pdf -sDEVICE = pdfwrite -dFILTERVECTOR -dFILTERTEXT input.pdf
gs -o onlyTXT.pdf -sDEVICE = pdfwrite -dFILTERVECTOR -dFILTERIMAGE input.pdf
gs -o onlyVCT.pdf -sDEVICE = pdfwrite -dFILTERIMAGE -dFILTERTEXT input.pdf
A imagem a seguir ilustra os resultados:
Linha superior, da esquerda: todo o "texto" removido; todas as "imagens" removidas; todos os "vetores" removidos. Linha inferior, da esquerda: apenas "texto" mantido; apenas "imagens" mantidas; apenas "vetores" mantidos.