Como solucionar problemas de congelamentos aleatórios, nos quais o sistema não aceita nenhuma entrada?
Eu tenho um computador que costumava rodar o Ubuntu há alguns anos sem problemas (não sei se algum hardware mudou). Recentemente, não importa qual distribuição Linux eu instale, ele congelará aleatoriamente até um ponto em que o cursor esteja congelado e não responderá a nenhuma entrada do teclado, incluindo alt + sysrq (quando o sistema não estiver congelado, eu posso alt + sysrq REISUB e ele será reiniciado). Não há respostas em O que devo fazer quando o Ubuntu congelar? que parecem 'funcionar' nesta situação.
Eu iniciei o congelamento com os seguintes sistemas: Ubuntu 12.04, Ubuntu 14.04, Ubuntu 14.10, Ubuntu 15.04, Ubuntu 15.10, bem como Fedora 22 e 23 (todas as versões de 64 bits). Isso acontece com o XFCE, o Unity e até o Gnome, o nouveau e as diferentes versões do driver proprietário da nvidia. Ele pode congelar mesmo no início da instalação ou durante uma sessão ao vivo. Às vezes, o sistema funciona por 5 minutos antes do congelamento e às vezes duas horas. O mesmo hardware pode executar um sistema operacional Windows por dias sem problemas.
Eu tentei configurar o Kernel Crash Dump, mas ele não parece disparar quando o sistema congela. Não há entradas no syslog ou no kern.log que parecem ter sido gravadas pouco antes do congelamento. Em alguns congelamentos, a última entrada no syslog ou no kern.log ocorreu 30 minutos antes.
Atualização: desconectei uma placa de rede sem fio e uma webcam USB, deixando a máquina funcionar durante a noite para ver se uma delas está causando isso. Será atualizado com os resultados.
Atualização 2: congelou novamente. Estou literalmente sem idéias. Todas as sugestões são bem-vindas.
Atualização 3: algumas especificações de hardware que podem ser relevantes:
Placa-mãe: Sabertooth 990FX R2.0
CPU: AMD FX-8350 Black Edition
GPU: GeForce GTX 660
Update3:
Atualizei recentemente o BIOS do Sabertooth 990FX R2.0 para a versão 2501 (a versão mais recente atualmente disponível), sem nenhuma sorte.
Atualização 4:
Eu corri um memtest por 9 horas, várias passagens e nenhum erro. Existem dois DIMMS encaixados nos slots 2 e 4 na placa-mãe. Agora tentei remover o do slot 4 e vou ver se consigo reproduzir o congelamento. Depois eles serão trocados.
Atualização 5:
Ele já dura muitas horas sem congelar até agora, acho difícil acreditar em mim. Pode ser resolvido, mas não entendo o porquê. Acho que vou tentar dar alguns dias para ter certeza.
Atualização 6:
Não houve congelamentos e devo concluir que eles foram causados por falhas de memória. Como o memtest não mostrou nenhum erro, é provável que eu nunca tivesse descoberto o que estava errado se não tivesse começado a desconectar partes 'aleatórias'. Essa é realmente a melhor abordagem? Se alguém puder escrever uma maneira mais sistemática de fazer algo assim, talvez com a solução de problemas no Ubuntu, eu concederei a eles a recompensa.