É possível descobrir quais algoritmos de compactação foram usados para imagens em um documento PDF?
É possível descobrir quais algoritmos de compactação foram usados para imagens em um documento PDF?
Respostas:
Você pode usar pdfimages -list $file
nos sistemas Unix / Linux; no Windows, talvez você possa instalar o poppler para obter acesso à ferramenta (consulte https://en.wikipedia.org/wiki/Pdfimages ). Observe que este é um aplicativo de linha de comando, sem interface gráfica com o usuário. Sua saída será semelhante
page num type width height color comp bpc enc interp object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
1 0 image 1240 1753 gray 1 8 image no 8 0 150 150 301K 14%
2 1 image 1240 1753 gray 1 8 image no 22 0 150 150 281K 13%
3 2 image 1240 1753 gray 1 8 image no 36 0 150 150 336K 16%
Onde a enc
coluna informa o algoritmo de codificação, os possíveis valores são listados na página de manualpdfimages
.
Tipo de.
Se você abrir um PDF em um editor de texto, encontrará uma linha como esta para cada imagem:
<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...
Esta imagem usa o filtro FlateDecode, "um filtro comumente usado com base no algoritmo zlib / deflate (também conhecido como gzip, mas não zip)"
<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...
Esta imagem usa o filtro DCTDecode, "um filtro com perdas baseado no padrão JPEG"
As definições de filtro são da página Wikipedia do Portable Document Format , que possui uma lista de todos os filtros suportados.
No entanto, pode ser difícil determinar qual imagem é qual em um editor de texto - os objetos não ocorrem necessariamente em ordem de leitura. Dividir o PDF em páginas únicas pode ajudar aqui.
Acho que o Enfocus Pitstop Pro , um plug-in Acrobat, pode fornecer essas informações (juntamente com dimensões, posição, DPI etc.) em seu inspetor de objetos, mas eu não tenho mais isso e não consigo encontrar nenhuma menção a esse item específico. atributo em seu manual.