Como os arquivos tar são um formato de streaming - você pode cat
dois deles juntos e obter um resultado quase correto -, não é necessário extraí-los para o disco para fazer isso. Você pode descompactar (apenas) os arquivos, concatená-los e recomprimir esse fluxo:
xzcat *.tar.xz | xz -c > combined.tar.xz
combined.tar.xz
será um tarball compactado de todos os arquivos nos tarballs do componente que está apenas ligeiramente corrompido. Para extrair, você terá que usar a --ignore-zeros
opção (no GNU tar
), porque os arquivos possuem um marcador "fim de arquivo" que aparecerá no meio do resultado. Fora isso, porém, tudo funcionará corretamente.
O GNU tar
também suporta um --concatenate
modo para produzir arquivos combinados. Isso tem as mesmas limitações acima - você deve usar --ignore-zeros
para extrair - mas não funciona com arquivos compactados. Você pode criar algo para enganá-lo no trabalho usando substituição de processo, mas é um aborrecimento e ainda mais frágil.
Se houver arquivos que aparecem mais de uma vez em arquivos tar diferentes, isso não funcionará corretamente, mas você terá esse problema independentemente. Caso contrário, isso lhe dará o que você deseja - canalizando a saída xz
é como tar
comprime sua saída de qualquer maneira.
Se os arquivos que funcionam apenas com uma tar
implementação específica não são adequados para seus propósitos, anexar ao arquivo r
é seu amigo:
tar cJf combined.tar.xz dummy-file
for x in db-*.tar.xz
do
mkdir tmp
pushd tmp
tar xJf "../$x"
tar rJf ../combined.tar.xz .
popd
rm -r tmp
done
Isso apenas extrai um único arquivo de cada vez, portanto, o espaço de trabalho é limitado ao tamanho do conteúdo de um único arquivo. A compactação está sendo transmitida exatamente como teria sido se você tivesse feito o arquivo final de uma só vez, para que fique o melhor que poderia ter sido. Você faz muita descompressão e recompressão em excesso que tornarão isso mais lento que as cat
versões, mas o arquivo resultante funcionará em qualquer lugar sem nenhum suporte especial.
Observe que, dependendo do que você deseja, basta adicionar os arquivos tar não compactados a um arquivo morto. Eles compactarão (quase) exatamente o conteúdo em um único arquivo e reduzirá a sobrecarga da compactação para cada arquivo. Isso seria algo como:
tar cJf combined.tar.xz dummy-file
for x in db-*.tar.xz
do
xz -dk "$x"
tar rJf combined.tar.xz "${x%.xz}"
rm -f "${x%.xz}"
done
Isso é um pouco menos eficiente em termos do tamanho final compactado, porque há cabeçalhos tar adicionais no fluxo, mas economiza algum tempo na extração e na adição de todos os arquivos como arquivos. Você acabaria combined.tar.xz
contendo muitos db-*.tar
arquivos (não compactados) .