O artigo menciona 9 camadas de arquivos zip, portanto, não é um caso simples de compactar zeros. Por que 9, por que 10 arquivos em cada um?
Primeiro, o artigo da Wikipedia diz atualmente 5 camadas com 16 arquivos cada. Não sei de onde vem a discrepância, mas não é tão relevante. A verdadeira questão é por que usar o aninhamento em primeiro lugar.
DEFLATE, o único método de compactação comumente suportado para arquivos zip *, possui uma taxa de compactação máxima de 1032. Isso pode ser alcançado assintoticamente para qualquer sequência repetida de 1 a 3 bytes. Não importa o que você faz com um arquivo zip, desde que esteja usando apenas DEFLATE, o tamanho descompactado será no máximo 1032 vezes o tamanho do arquivo zip original.
Portanto, é necessário usar arquivos zip aninhados para obter taxas de compactação realmente ultrajantes. Se você tiver 2 camadas de compactação, a proporção máxima se tornará 1032 ^ 2 = 1065024. Para 3, é 1099104768 e assim por diante. Para as 5 camadas usadas no 42.zip, a taxa de compressão máxima teórica é 1170572956434432. Como você pode ver, o 42.zip real está longe desse nível. Parte disso é a sobrecarga do formato zip, e parte disso é que eles simplesmente não se importaram.
Se eu tivesse que adivinhar, diria que o 42.zip foi criado apenas criando um arquivo grande e vazio e fechando e copiando repetidamente. Não há nenhuma tentativa de ultrapassar os limites do formato ou maximizar a compactação ou qualquer outra coisa - eles escolheram arbitrariamente 16 cópias por camada. O objetivo era criar uma grande carga útil sem muito esforço.
Nota: Outros formatos de compactação, como o bzip2, oferecem taxas de compactação máximas muito, muito, muito maiores. No entanto, a maioria dos analisadores de zip não os aceita.
PS É possível criar um arquivo zip que será descompactado para uma cópia de si mesmo (um arquivo). Você também pode criar um que descompacte em várias cópias de si mesmo. Portanto, se você descompactar recursivamente um arquivo para sempre, o tamanho máximo possível será infinito. A única limitação é que ele pode aumentar no máximo 1032 em cada iteração.
PPS A figura 1032 pressupõe que os dados do arquivo no zip não sejam comuns. Uma peculiaridade do formato do arquivo zip é que ele possui um diretório central que lista os arquivos no arquivo morto e compensa os dados do arquivo. Se você criar várias entradas de arquivo apontando para os mesmos dados, poderá obter taxas de compactação muito mais altas, mesmo sem aninhamento, mas esse arquivo zip provavelmente será rejeitado pelos analisadores.