Eu tenho um servidor Linux com muitos discos de 2 TB, todos atualmente em um LVM, resultando em cerca de 10 TB de espaço. Eu uso todo esse espaço em uma partição ext4 e atualmente tenho cerca de 8,8 TB de dados.
O problema é que geralmente recebo erros nos meus discos e, mesmo que eu os substitua (ou seja, copio o disco antigo para um novo com o dd, coloco o novo no servidor), assim que os erros aparecem, Costumo receber cerca de 100 MB de dados corrompidos. Isso faz o e2fsck enlouquecer toda vez e geralmente leva uma semana para colocar o sistema de arquivos ext4 em um estado saudável novamente.
Portanto, a pergunta é: O que você recomendaria que eu usasse como sistema de arquivos no meu LVM? Ou o que você recomendaria que eu fizesse (eu realmente não preciso do LVM)?
Perfil do meu sistema de arquivos:
- muitas pastas de diferentes tamanhos totais (algumas totalizando 2 TB, outras totalizando 100 MB)
- quase 200.000 arquivos com tamanhos diferentes (3/4 deles com cerca de 10 MB, 1/4 entre 100 MB e 4 GB; atualmente não posso obter mais estatísticas sobre arquivos, pois minha partição ext4 está completamente destruída por alguns dias)
- muitas leituras, mas poucas gravações
- e preciso de tolerância a falhas (parei de usar o mdadm RAID porque não gosta de ter UM erro em todo o disco e às vezes tenho discos com falha, que substituo o mais rápido possível, mas isso significa que posso obter dados corrompidos em meu sistema de arquivos)
O principal problema são os discos com falha; Posso perder alguns arquivos, mas não posso perder tudo ao mesmo tempo.
Se eu continuar usando o ext4, ouvi dizer que eu deveria tentar criar sistemas de arquivos menores e "mesclá-los" de alguma forma, mas não sei como.
Ouvi dizer que o btrfs seria bom, mas não consigo encontrar nenhuma pista sobre como ele consegue perder uma parte de um disco (ou um disco inteiro), quando os dados NÃO são replicados ( mkfs.btrfs -d single
?).
Qualquer conselho sobre a questão será bem-vindo, desde já, obrigado!