Estou começando a obter uma coleção de computadores em casa e, para apoiá-los, tenho minha caixa Linux "servidor" executando uma matriz RAID.
É atualmente mdadm
RAID-1
, indo RAID-5
uma vez eu tenho mais unidades (e então RAID-6
eu estou esperando). No entanto, ouvi várias histórias sobre dados corrompidos em uma unidade e você nunca percebeu que a outra unidade estava sendo usada, até o momento em que a primeira unidade falha e você descobre que sua segunda unidade também está danificada (e 3ª, 4ª , 5ª unidade).
Obviamente, os backups são importantes e eu também cuido disso, mas sei que já vi scripts que pretendem ajudar contra esse problema e permitem que você verifique seu RAID enquanto ele estiver em execução. No entanto, procurando esses scripts novamente agora, acho difícil encontrar algo que pareça com o que corri antes e sinto que estou desatualizado e não entendo o que mudou.
Como você verificaria um RAID em execução para garantir que todos os discos ainda estejam sendo executados normalmente?
Monitoro o SMART em todas as unidades e também me mdadm
enviei um e-mail em caso de falha, mas eu gostaria de saber que minhas unidades ocasionalmente também se "verificam".