[Suponho que você esteja confortável com o impacto no desempenho do RAID6 e se preocupe apenas com falhas]
Estou usando os números de http://en.wikipedia.org/wiki/Standard_RAID_levels e sou péssimo em matemática, portanto, isso pode estar errado. Vamos supor que 5% das suas unidades morram dentro de 1 ano.
A probabilidade de um membro dupla RAID1 outright morrer é a probabilidade de uma determinada unidade morrendo, quadrado: P(R1) = P(drive)^2
.
Portanto, com a taxa de falha de 5%, você acaba com:
P(R1) = 0.005^2 = 0.0025 = 0.25%
(Aqui é onde eu não tenho certeza sobre a matemática - faz sentido, mas isso não significa nada)
Portanto, as chances de perder qualquer membro do R1 são de 0,25% ao ano, mas você tem vários deles unidos e, se algum deles morrer, sua matriz estará morta. então você precisa para ligar o número P (R1) na matemática falha R0: P(R10) = 1 - (1 - P(R1))^(n_R1)
. Suponhamos que você tenha 8 unidades no total (e não as substitua quando elas falharem), portanto, uma faixa entre 4 R1s:
P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%
Portanto, você tem cerca de 1% de chance de perder um RAID10 com 8 unidades com 5% de chance de falha por ano.
De maneira simplista, a probabilidade de falha do RAID6 é a probabilidade de qualquer unidade morrer, em cubos (desde que você precise perder três unidades para que falhe), por exemplo:
P(drive)^3 = (5%)^3 = 0.0125%
Portanto, no cenário "várias unidades morrendo", o RAID6 tem cerca de 1/80 de probabilidade de falhar do que o RAID10 com as mesmas unidades.
Infelizmente, a vida é complicada e você precisa lidar com setores que estão indo mal. É bem provável que erros aleatórios sejam introduzidos em suas unidades que passam despercebidos. Não estou mais copiando a wikipedia aqui, mas acho que a probabilidade de um setor ruim aparecer em qualquer unidade é P(bs) = P(UBER) * bits_written
. Se isso acontecer, a recuperação após uma falha na unidade é impossível em um R1 e mais complicada em um R6.
Obviamente, tudo isso é discutível se o controlador ou driver RAID6 estiver com erros e introduzir erros nos seus dados ou corromper sua matriz :-)