Sim, a compactação sem perdas aproveita o fato de muitos arquivos não serem aleatórios. Sim, a maioria dos arquivos multimídia não é aleatória.
As imagens de fax são um bom exemplo desse efeito. Em sua forma mais simples, uma imagem de fax é uma imagem em preto-e-branco em 2-D, obtida pela digitalização de uma única página de algum documento. Se você representar esta imagem como uma sequência de bits, um bit por pixel (0 = branco, 1 = preto), descobrirá que os dados binários resultantes não são de todo aleatórios. Por exemplo, aqui estão alguns padrões não aleatórios que você encontrará:
Normalmente, as imagens de fax têm muito mais pixels brancos do que pixels pretos.
Além disso, é mais provável que cada pixel tenha a mesma cor do pixel à esquerda do que uma cor diferente.
Para um padrão mais sofisticado: imagine digitalizar pixels horizontalmente, da esquerda para a direita, e contando o comprimento de cada "execução" de pixels consecutivos da mesma cor. Em seguida, execuções longas são mais comuns que execuções curtas, e execuções longas de pixels brancos são mais comuns que execuções longas de pixels pretos.
Os algoritmos de compactação de fax foram projetados para aproveitar esses aspectos não aleatórios. Os algoritmos iniciais de compactação de fax são um exemplo particularmente bom, porque são esquemas simples de compactação sem perdas que exploram diretamente essas propriedades não aleatórias das imagens digitalizadas.
Por exemplo, um esquema anterior para compactar imagens de fax usava a codificação de execução combinada com a codificação Huffman . A codificação de duração da execução substitui cada execução de pixels da mesma cor por um único número inteiro contando a duração da execução. Por exemplo, 00000110001 se torna "5 2 3 1". A codificação de execução explora o fato de que os pixels tendem a ocorrer em execuções da mesma cor. A codificação Huffman explora ainda mais o fato de que algumas durações são mais comuns que outras. Veja aqui um exemplo detalhado de como um desses primeiros esquemas funcionou - o esquema é simples e elegante e explora diretamente os padrões mencionados acima.
Esses esquemas não oferecem compactação, em média, para arquivos aleatórios. No entanto, as imagens de fax digitalizadas não são aleatórias e, como resultado, esses esquemas de compactação podem oferecer economias substanciais.
Comentários semelhantes se aplicam a outros arquivos multimídia. Os padrões presentes em outros tipos de arquivos multimídia podem ser mais complexos, mas ainda existem muitos padrões que tornam os dados não aleatórios.