Apenas um ponto para esclarecer um pouco:
- Se um disco pode falhar sem saber previamente quando falhará ... por que dois não podem falhar ao mesmo tempo? ou três ou quatro ou cinco, etc.?
Mas, pense nessa outra situação:
- Um disco falhou
- Você coloca um novo e deixa 'reconstruir' para ficar seguro
- Enquanto essa 'reconstrução' foi feita (talvez algumas horas), outro disco falha
Você perdeu tudo !!! Essa é a principal razão para tolerar uma falha simultânea de dois discos.
Mas se você é realmente paranóico (como eu), você usará apenas Stripping, nenhum outro nível de RAID.
Eu estou louco? Não, claro ... não me importo que um disco falhe e perca todos os dados! Eu realmente não vou perder nada só porque sou realmente paranóico.
Meu esquema paranóico:
- ZFS com strip (discos 2x, 3x, 4x ... ou 10x), apenas para ajustar a largura de banda máxima do barramento (sata III, usb 3.1 gen 2, etc)
- E outros cinco ZFS semelhantes (sem energia, por isso não pode ser danificado)
Como usar todos esses ZFS:
- Tenha apenas dois deles ao mesmo tempo (apenas para sincronizar as mudanças) ... como um mestre com cinco escravos
Ponto de vista paranóico:
- Se um ZFS falhar ... como ter sido atingido por uma tempestade, queimado, roubado, etc ... ainda tenho cinco cópias a mais em locais diferentes (banco, bunker, nuvem de internet, casa de amigos, casa de férias etc.)
Para sincronizar alguns deles ... preciso carregar comigo um ZFS e fazer a sincronização no outro local físico / país / etc ... para usar um desses escravos.
Pense quando eu falo sobre HDDs em um ZFS, em outro ZFS pode ser 3.1 Gen2 64GiB USB sticks! Não há necessidade de tamanho, tipo, etc. idênticos
Ponto de vista realmente paranóico.
Para aqueles que não são tão paranóicos, e se eles conseguem perder tudo ... há níveis de RaidZ ... eu prefiro 'espelhar' por mim mesmo.
Outra vantagem das sincronizações manuais é a sua própria falha:
- Você tem um hipotético perfeito nunca falha no sistema ZFS, mas decide excluir um arquivo ... alguns dias após descobrir que perdeu o arquivo que deseja excluir e excluir um que não queria (por erro humano) .. você está sem sorte, a menos que tenha um backup
Então ... de novo ... se você precisar de um backup, por que não acelerar o ZFS no máximo apenas distribuindo? ... você ainda precisará fazer o backup, afinal.
Bem, a resposta pode ser:
- Partição do sistema para o sistema online a24h
Para partições de dados, não vejo a necessidade de níveis RaidZ, em vez de ter um clone USB ZFS externo pronto para ser conectado assim que o ZFS principal em uso falhar ... basta desmontar o ponto principal do ZFS e montar o outro ZFS bom no lugar ... depois, com outra máquina, recrie o ZFS off-line que foi danificado.
Se você tiver dois computadores, terá o que precisa 7x24h com apenas alguns segundos (tempo de inicialização) do tempo de inatividade.
Para usuários domésticos que desejam que suas fotos fiquem seguras ... use mais de dois ZFS e tenha pelo menos um ou dois deles nunca conectados ao mesmo tempo que os demais. Paranoico? De modo nenhum.
É só que eu aprendo da maneira mais difícil como as coisas podem dar realmente errado!
Só para esclarecer ... o que aconteceu ...
- Eu estava usando o PC normalmente
- Os dados estavam começando a falhar
- Tirei os HDDs e coloquei os que estavam OK
- Os dados neles também foram danificados em menos de dez segundos
- Perdi todos os meus dados (não totalmente desde que eu era um pouco paranóico e tenho BackUp em mídia de DVD)
O problema estava realmente no controlador (integrado na placa principal), não nos discos ... estava alterando os dados nas operações de leitura / gravação.
Desde então ... meus dados não estão mais em discos sata internos ... apenas em gabinetes externos USB 3.1 Gen 2 eu posso conectar e desconectar (cada disco em seu próprio gabinete) ... e quando um falha ... Eu testei todas as coisas antes de conectar ao PC qualquer coisa com dados reais ... RAM, processador, porta USB, etc ... com um gabinete USB fictício para testar padrões ... se estiver tudo bem ... então eu testo o disco com falha ... se funciona em outro gabinete ou não, em outro PC ou não, etc ... para realmente saber quem está causando a falha ... realmente paranóico, eu sei!
Mas aprendendo com a experiência:
- Nunca confie que uma falha no disco seja causada pelo próprio disco ... teste-o ... pode ser o controlador, os cabos, a fonte de alimentação, etc.
- Ou pior, poderia ser a RAM
Falando sobre RAM, eu tinha um PC não tão antigo (processador de 64 bits baseado em BIOS) que se (pense em três módulos de RAM idênticos, chame-os de A, B e C):
- eu coloquei A no PC funciona perfeitamente (não importa em qual dos quatro slots)
- eu coloquei B no PC funciona perfeitamente (não importa em qual dos quatro slots)
- Coloquei C no PC funciona perfeitamente (mas apenas em um dos quatro slots, na outra árvore, ele causa muitas falhas, BSODs, etc.)
- eu coloquei A & B causa muitas falhas, BSODs, etc
- eu coloquei o A&C no PC funciona perfeitamente (não importa em qual dos quatro slots)
- eu coloquei B & C no PC funciona perfeitamente (não importa em qual dos quatro slots)
- eu coloquei A & B & C no PC que causa muitas falhas, BSODs, etc
Se eu testar esses módulos em outro PC, todos eles funcionarão muito bem, sem problemas, sem defeitos etc.
As coisas podem ficar realmente loucas ... e se você não testar todas as combinações, não poderá saber o que está falhando ... sim, realmente paranóico para testar todas as combinações de três módulos de ram em quatro slots ... mas o que eu tinha descoberto me deixou cego ... o módulo que falha sozinho funciona perfeito se outro estiver presente, mas não se houver outros dois ... sim, eu também testei com outros três e falhei!
Ah, sim, todas da mesma marca, tipo, etc ... idênticas ... a única maneira de diferenciá-las é um adesivo que eu coloquei nelas para tal! E sim, comprados ao mesmo tempo, eles vieram na mesma caixa de plástico trancada de fabricação.
Às vezes, uma falha no ZFS pode ser causada pela RAM ... então, não importa quantos níveis de RaidZ você tenha ... você pode perder tudo.
Ah, quase esqueça ... use memória ECC, caso contrário, o ZFS não pode ser confiável! E não use nenhum HDD com cache interno, internat RAID, etc., a menos que seja projetado para gravar no pedido enviado (ou fazer todos eles em um corte de energia).
Eu só uso HDDs com capacidade de energia interna suficiente para gravar todo o seu cache nas placas após uma perda abrupta de energia!
Todos esses pontos / fraquezas me deixaram com uma conclusão:
- Melhor acelerar as coisas e fazer seus próprios backups
- Tenha cerca de 100% de cópias off-line e sem energia
- Tenha algo pronto para receber energia e substituir a peça com falha
É por isso que eu tenho> 2 PCs com> 10 HDDs USB (5 cópias ZFS * 3 HDDs despojados) ... eu tenho o melhor de ... segurança e velocidade! Mas eu recebo a pior parte ... preciso sincronizar todos eles periodicamente ... mas a segurança dos dados é a parte mais importante! também eu não quero esperar muito por essas sincronizações (aka, striping vem no trabalho).
E se uma faixa de 3 * HDDs falhar ... eu posso testar qual deles falhou desses três por algumas horas / dias / semanas ... enquanto eu tenho outra cópia do ZFS On-Line e trabalhando ... depois de ter certeza de que o outro dois estão OK, eu compro um novo (talvez 30 a 45 dias para chegar) e recrio esses ZFS de 3 * HDDs e coloco dados nele para ter a quinta cópia novamente.
Não é nada barato! Mas não como preço do data center principal, é claro ... e sem conta de luz (a maioria dos HDs não tem energia, apenas 3 ou 6 ao mesmo tempo).
Espero que alguém ache a idéia útil (eu a uso diariamente).