Se o RAID5 / 6 for arriscado devido ao URE, os esquemas completos de backup / restauração também estão em risco?


11

Pelo que entendi, você tem uma grande chance de encontrar um URE durante uma reconstrução devido à necessidade de ler uma grande quantidade de dados para executar a tarefa.

Esse problema também afeta os cenários de backup e restauração de grandes quantidades de dados? Se você precisar fazer uma restauração completa de um backup de 10 TB, os UREs parecerão igualmente prováveis.


3
Não é realmente um problema com o RAID6 e o ​​RAID não se destina ao backup, mas à disponibilidade.
User9517 28/05

Um backup não é suficiente.
Restabeleça Monica - M. Schröder

Respostas:


13

O verdadeiro problema em relação ao URE e ao RAID5 é que, ao encontrar um único URE, muitos controladores de hardware simplesmente abortam a reconstrução do RAID e declaram a morte do array, colocando todos os seus dados offline. Embora essa seja a "aposta mais segura" em relação à possível corrupção de dados, nem sempre é a melhor coisa a fazer (por exemplo: pense em um URE que afeta um setor de dados livre / não alocado por sistema de arquivos. Embora seja seguro ignorar o controlador de hardware colocará toda a matriz offline).

O RAID6 é muito menos propenso ao URE, pois a redundância de dois discos realmente reduz a possibilidade de ter UREs simultâneos no mesmo setor de disco / LBA.

Ao mesmo tempo, o RAID de software (por exemplo: mdadm) geralmente é muito mais flexível que o RAID de hardware, permitindo a recuperação da matriz RAID5 degradada, mesmo quando alguns UREs são encontrados.

Restaurando a partir do backup, você geralmente possui ferramentas mais flexíveis; isso significa que, no caso comum, você pode pular os setores quebrados / ilegíveis e prosseguir com a recuperação de outros dados.


3

Qualquer coisa no volume está em risco

Se você declarar ter uma preocupação com o URE em um volume / LUN que sofreu uma falha na unidade RAID 5/6, todos os dados nesse volume estariam em risco.

Verifique se você está armazenando seus dados em um volume / LUN diferente do seu backup. A melhor prática indicaria que seu backup está em um dispositivo de armazenamento completamente diferente dos dados de produção.

O URE normalmente está no nível do bloco, portanto, qualquer coisa nesse volume estaria em risco de corrupção. O formato no nível do bloco está baixo na pilha. NTFS ou VMFS (qualquer formato) continua no nível do bloco e assim por diante. Como o nível do bloco no volume RAID fica abaixo de tudo, todos os dados são afetados por problemas no nível do bloco.

Espero estar respondendo à sua pergunta corretamente.


3

Em princípio, sim, mas se você armazenar seu backup em um RAID6 (como exemplo), você terá o benefício da redundância; portanto, a taxa total de erros será muito menor e, com isso, a chance de um URE durante a recuperação.

Se você usar uma solução de backup em fita, as taxas de erro serão muito mais baixas (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.