Respostas:
Eu recomendaria instalar o smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki ) em sua máquina. Este é um software que pode verificar a integridade de seus discos, caso contrário, ele estará verificando / var / log / messages ou / var / log / syslog para qualquer menção de erros scsi
dmesg
O kernel registrará qualquer mensagem de diagnóstico sobre dispositivos de E / S, para que você possa verificar essas mensagens com o comando dmesg.
O monitoramento SMART é uma boa maneira. Como root, smartctl -a /dev/hda
onde hda é a unidade que você deseja ... pode ser hdb, sda, etc.
Essa é uma resposta muito vaga, no entanto. Se você possui um servidor fabricado por qualquer um dos grandes fabricantes (Dell, HP, etc), é provável que haja melhores recursos de monitoramento disponíveis.
Você pode tentar a verificação completa da partição / dev / sda1 (por exemplo) como
fsck -f /dev/sda1
ou tente o teste não descritivo completo de leitura e gravação de determinada partição
badblocks -vn /dev/sda1
/dev/sda1 is mounted; it's not safe to run badblocks!
e2fsck: Cannot continue, aborting.