fundo
Meu sistema de desktop pessoal em casa possui 5 unidades SATA montadas no interior. Recentemente, meu sistema começou a falhar de maneiras estranhas, como pânico aleatório no kernel, e eu finalmente o localizei para degradações aleatórias na matriz RAID. Às vezes eu conseguia inicializar, outras vezes não e assim por diante. Depois de perseguir os problemas do software por um tempo, finalmente fui puxar os discos e descobri o verdadeiro motivo pelo qual eles estavam falhando: eles eram mais quentes do que um churrasco no dia 4 de julho! A ventoinha do gabinete dianteiro estava presa e o ventilador PS tinha um conector de energia solto preso em sua grade, de modo que o interior do gabinete estava cozinhando.
Como espera, encontrei um ventilador doméstico e esfriei aquele otário. Funcionou muito bem com tudo de bom e descontraído. Nesse período, aprendi como obter as leituras de temperatura da unidade com o SMART
for i in a b c d e; do
sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done
Agora eu sei que, com o meu gabinete, abri um ventilador doméstico limpando permanentemente as teias de aranha que as unidades correm entre 31 e 32 °. Um teste rápido sem ventilação para replicar o estado de falha mostra que as unidades atingiram os 40 anos rapidamente. Eu não sei o quão ruim foi durante a falha real ou há quanto tempo é assim.
Com isso em mente, substituí as ventoinhas defeituosas, adicionei mais algumas, atualizei a frontal soprando as unidades de 80 a 120 mm e fechei-a novamente. Com ele de pé na vertical novamente, a faixa de temperatura agora está geralmente em 32 ° na parte inferior do aparelho e 37 ° na parte superior.
A questão
Qual é a faixa geral de temperatura operacional segura para drives SATA? 37 ° deve ser uma preocupação ou o dano ao inversor não é um problema até depois de um certo ponto?
Embora as unidades pareçam ter um bom desempenho agora, qual a probabilidade de exposição ao calor no passado para torná-las propensas a falhas agora?