Em seu romance pouco conhecido, PDF Karenina , Leo Tolstoy escreveu:
Os arquivos PDF idealmente codificados são todos iguais; todo arquivo PDF codificado subotimamente é codificado subotimamente à sua maneira.
É difícil alguém responder por que seus arquivos PDF são maiores depois que a Visualização os modifica. Um arquivo PDF consiste em muitos tipos diferentes de dados: imagens, fluxos de conteúdo, fontes, sobrecarga de documentos, espaços de cores, estados de gráficos estendidos e uma tabela de referência cruzada. Assim como uma frase pode ser concisa e outra detalhada, mas ambas são inglesas válidas e dizem a mesma coisa, também um arquivo PDF pode ter uma maneira mais detalhada de representar o mesmo conteúdo que um arquivo PDF mais conciso. Teríamos que examinar seus arquivos PDF exatos. É provável que eles tenham sido criados por uma variedade de softwares diferentes, alguns consistentes, outros nem tanto.
Também importa qual versão do Mac OS X e do Preview você está usando, porque isso determina o software que grava o novo arquivo PDF quando você faz um Save As in Preview.
No entanto, posso dizer o que é maior em alguns dos meus arquivos PDF. Esta história se aplica ao meu computador, executando o Mac OS X 10.5.8 e o Apple Preview 4.2 (469.5).
Um arquivo,, Giulio.pdfé um documento de 22 páginas com texto como texto, não imagens digitalizadas. Possui 461.092 bytes de tamanho. Abri na Visualização, fiz Arquivo ... Salvar como ... e salvei com um novo nome de arquivo. O novo arquivo é 724.421 bytes, ou 57% maior.
Abri cada arquivo com o Adobe Acrobat Professional, versão 8.3.1 para Mac OS. Eu fiz Avançada ... PDF Optimizer ... Uso de Espaço Auditoria ... . Uma pequena caixa de diálogo mostrava quantos bytes eram devidos a cada categoria de uso, além da porcentagem do tamanho total do arquivo da categoria.
O original Giulio.pdfpossui 390.754 bytes (84,75%) dedicados aos fluxos de conteúdo e zero bytes dedicados às imagens. Está no formato PDF 1.4. O arquivo salvo pelo Preview possui 675.846 bytes (93,29%) dedicados aos fluxos de conteúdo, também zero bytes de imagens e está no formato PDF 1.3. A visualização aumentou os fluxos de conteúdo 285.092 bytes e isso representa 73% da diferença de tamanho do arquivo entre os dois.
Gostaria de saber se o formato de arquivo PDF 1.3 era inerentemente menos eficiente para armazenar esse tipo de arquivo. Abri o original Giulio.pdfno Adobe Acrobat Professional 8 e fiz o Advanced ... PDF Optimizer ... Torne-o compatível com: Acrobat 3.0 e posterior e pressionei OK. Salvei o arquivo resultante com um novo nome. O arquivo resultante está no formato PDF 1.3 e tinha 452.356 bytes ou menos que o original. Seus fluxos de conteúdo são 375.171 bytes (82,94%), uma proporção semelhante, mas menor que os fluxos de conteúdo do arquivo original.
Portanto, parece que podemos concluir que o aplicativo Preview no Mac OS X 10.5.8 não é tão eficiente quanto outros criadores de PDF em criar fluxos de conteúdo concisos em arquivos PDF, e a diferença é suficiente para representar três quartos da diferença de tamanho em um arquivo PDF sem imagens.
Fiz um experimento semelhante form k.pdf, um documento de uma página digitalizado em papel. O arquivo original tem 303.730 bytes, dos quais 298.197 bytes (98,18%) são imagens. Uma cópia deste arquivo criado pela Visualização usando Salvar como ... é 300.601 bytes, ou 1% menor. Essa diferença de tamanho de arquivo é mais do que explicada por uma categoria menor de "sobrecarga de documento" de bytes no arquivo criado pela Visualização.
Assim, parece que também podemos concluir que a visualização nem sempre faz com que um arquivo PDF aumente de tamanho. Depende da natureza do arquivo PDF original e de quão conciso era para começar.