aqui está a minha situação.
Eu tenho um servidor Dell com um controlador Dell Perc 7i (controlador LSI).
Eu tinha um drive me dando um aviso de falha prevista, então liguei para o suporte e eles saíram e substituíram o drive e a matriz foi reconstruída, um padrão bastante comum.
Duas semanas depois, tenho outra unidade, me dando o aviso de falha prevista. Achei que talvez fosse um lote ruim de unidades ou coincidência, etc. Então, entre em contato com o suporte e analise com mais profundidade. Percebo que havia blocos defeituosos em uma das outras unidades que não falharam e esses blocos defeituosos foram copiados durante a reconstrução. Então agora eu tenho blocos ruins por todo o lado e eles estão lentamente matando minha matriz. Eu descobri que isso é chamado de matriz perfurada.
Portanto, o conselho deles era substituir todas as unidades, reconstruir a matriz e restaurar do backup. Exceto que eu tenho esse problema há algumas semanas, o que significa que meus backups estão com problemas ... e se eu restaurar a partir de um backup anterior (um mês atrás), perderei cerca de 4 semanas de dados do meu banco de dados que é totalmente inaceitável para o nosso escritório.
Minha pergunta é ... alguém já se recuperou de algo assim sem ter que perder dados ou sem a abordagem geral (jogue tudo pela janela e comece de novo)?
Eu encontrei um link que cobria meu cenário, não tenho certeza se ele esclarece a situação: http://www.theprojectbot.com/raid/what-is-a-punctured-raid-array/
Qualquer ajuda ou direção seria apreciada ! O que é que vocês acham?