Já aconteceu duas vezes em poucos dias que meu servidor está inoperante completamente, ou seja, http, ssh, ftp, dns, smtp, basicamente TODOS os serviços param de responder, como se o servidor tivesse sido desligado, exceto que ainda responde ao ping , que é o que mais me impressiona.
Eu tenho alguns scripts php que causam uma carga enorme (CPU e memória) no servidor em rajadas curtas, usadas por um pequeno grupo de usuários, mas geralmente o servidor "sobrevive" perfeitamente a essas rajadas e, quando desce, nunca coincidem com esses picos de uso (não estou dizendo que não possa ser relacionado, mas não acontece logo após esses).
Não estou pedindo para que você possa magicamente me dizer a causa final dessas falhas, minha pergunta é: existe um único processo cuja morte pode causar a queda de todos esses serviços simultaneamente? O engraçado é que todos os serviços de rede ficam inativos, exceto o ping. Se o servidor tivesse 100% da CPU consumida por algum processo, também não responderia ao ping. Se o apache travasse por causa de (por exemplo) um script php quebrado, isso afetaria apenas o http, não o ssh e o dns .... etc.
Meu sistema operacional é o Cent OS 5.6
Mais importante, após a reinicialização do servidor, quais logs do sistema devo observar? / var / log / messages não revela nada de suspeito.