Vi vários módulos de memória falharem totalmente em servidores operacionais na última década e um número um pouco maior de falhas ao gravar o Memtest86 em testes em hardware recém-entregue. Estes são sistemas de servidor, quase todos com memória ECC de um tipo ou de outro, portanto, esperaria problemas muito mais frequentes em sistemas clientes com RAM sem correção de erros. No entanto, não tenho um grande conjunto de amostras para trabalhar, temos algumas dezenas de servidores próprios e, em termos de comissionamento de sistemas de clientes, eu diria que já trabalhei em cerca de cem em um nível em que eu ' eu realmente estaria prestando atenção na RAM.
No lado do cliente, tenho um pouco mais de experiência em escala corporativa - fui engenheiro sênior de um grupo que gerenciava PCs com 50k de usuários finais há alguns anos e nunca vimos falhas de disco rígido ou RAM como um problema significativo, certamente não era. algo que afetou qualquer porcentagem mensurável de sistemas. Isso não quer dizer que não aconteceu, apenas que eu ficaria muito surpreso se fosse um problema que afetasse mais de 1% dos desktops e notebooks de classe empresarial. Alguns modelos específicos demonstrariam taxas de falha realmente altas relacionadas ao controle de qualidade, o primeiro lote do IBM Thinkpad T30 teve um problema com seu segundo slot DIMM, o que nos levou a reparar e substituir alguns milhares de máquinas em determinado momento.
Esta publicação no blog de Larry Osterman, da Microsoft, de 2005, pode dar uma explicação possível para alguns deles - sua análise de alguns erros estranhos relatados no conjunto de dados bastante grande que vem do Relatório de Erros do Windows indica que muitos desses problemas estranhos são causados por relógio. Se é provável que um número significativo de usuários finais esteja usando o kit de nível de consumidor com overclock, isso pode estar relacionado aos seus erros.