Realmente, o fato de os arquivos já estarem compactados não é o problema crucial. É isso: a compactação em geral só pode funcionar se os dados tiverem algum tipo de redundância . Esse é praticamente sempre o caso de arquivos não compactados - no entanto, não é necessariamente óbvio qual é a redundância. Os algoritmos de compactação de uso geral visam principalmente o tipo de coisa óbvia nos arquivos de texto: muitas palavras aparecem não apenas uma vez, mas muitas vezes de forma idêntica, talvez frases de palavras possam ser combinadas etc. etc. Os algoritmos são muito bons em generalizando isso para qualquer coisa, de listas de números de telefone codificados em ASCII sobre poesia chinesa a código de máquina binário, mas eles não podem funcionar para qualquer tipo de dados. Em particular, os arquivos de mídia são conceitualmentedados analógicos , em uma representação digital barulhenta. Isso significa que não há realmente nenhum tipo de redunção de arquivo de texto: alguns motivos podem ser recorrentes, mas sempre com uma configuração ligeiramente diferente do ruído do sensor. É por isso que todos os formatos de imagem / AV compactados usam alguma transformação habilmente escolhida como sua primeira etapa de codificação, normalmente baseada em DCT ou wavelets . Essas transformações, grosso modo, movem as porções de imagem e porções de ruído para locais diferentes, para que possam ser separadas e com compressão com perdas, você retém apenas as informações que considera mais "importantes", que não incluem o ruído, enquanto as " boa informação "tem muita redundância. (Não é assim que funciona, mas é o que acontece.)
Se os compressores de uso geral usassem essas transformações, o efeito seria o oposto: a maioria das informações digitais seria na verdade classificada erroneamente como algum tipo de ruído, porque carece da estrutura "suave" encontrada nos sinais analógicos. E após a compactação de vídeo com perda, obviamente não é mais possível encontrar a suavidade analógica ou a recorrência digital (se fosse, os codecs usariam outro estágio bzip ou algo parecido!)