Desci na toca do coelho depois que as outras respostas falharam e consegui descobrir que minha versão do tar (1.27.1 do repositório openSUSE 42.3 OSS) estava usando o pax
formato de arquivo não determinístico por padrão, o que significa que mesmo sem compactação (e até mesmo definindo o mtime explicitamente) os arquivos criados com tar dos mesmos arquivos seriam diferentes:
$ echo hi > test.file
$ tar --create --to-stdout test.file # long form of `tar cO test.file`
./PaxHeaders.13067/test.file0000644000000000000000000000013213427447703012603 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
$ tar --create --to-stdout test.file
./PaxHeaders.13096/test.file0000644000000000000000000000013213427447703012605 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
Observe que a saída acima difere, mesmo que nenhuma compactação esteja sendo usada ; o conteúdo do arquivo descompactado (gerado pela execução do tar duas vezes no mesmo conteúdo) é diferente; portanto, o conteúdo compactado também será diferente mesmo quando usado GZIP=-n
como outras respostas sugerem
Para contornar isso, você pode especificar --format gnu
:
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
Isso funciona com a sugestão sobre o gzip acima:
# gzip refuses to write to stdout, so we'll use the `-f` option to create a file
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
# without GZIP=-n we see a different hash
$ tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
682ce0c8267b90f4103b4c29903c5a8d test.file.tgz
No entanto, além de razões válidas para preferir melhores formatos de compactação do que o gzip , você pode considerar usar o xz (que tar também suporta com os sinalizadores --xz
ou em -J
vez de -z
), porque você economiza um passo aqui; o comportamento padrão de xz
é gerar a mesma saída compactada quando o conteúdo não compactado for o mesmo; portanto, não há necessidade de especificar uma opção como GZIP=-n
:
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
touch filename
que altera a hora modificada de um arquivo é suficiente para alterar a soma de verificação.