Quase todos os arquivadores modernos fazem exatamente isso, a única diferença é que eles se referem a ele como um arquivo "sólido", pois em todos os arquivos são concatenados em um único fluxo antes de serem alimentados pelo algoritmo de compactação. Isso é diferente da compactação zip padrão, que compacta cada arquivo um por um e adiciona cada arquivo compactado ao arquivo morto.
O 7-zip, por sua própria natureza, efetivamente alcança a desduplicação. O 7-Zip, por exemplo, pesquisará arquivos, os classificará por tipos e nomes de arquivos semelhantes e, portanto, dois arquivos do mesmo tipo e dados serão colocados lado a lado no fluxo, indo para os algoritmos do compressor. O compressor verá muitos dados que viu muito recentemente e esses dois arquivos verão um grande aumento na eficiência da compactação em comparação com a compactação dos arquivos um por um.
O Linux tem visto um comportamento semelhante por um longo tempo através da prevalência de seu formato ".tgz" (ou ".tar.gz" para usar sua forma completa), pois o tar simplesmente mescla todos os arquivos em um único fluxo (embora sem classificação e agrupamento de arquivos) e depois a compactação com o gzip. O que falta é a classificação que o 7-zip está fazendo, o que pode diminuir um pouco a eficiência, mas ainda é muito melhor do que simplesmente misturar vários arquivos compactados individualmente da mesma maneira que o zip.