Ultimamente, tenho enfrentado algum tempo de inatividade em alguns sites do Drupal que implantei. Eu gostaria de abordar o problema proativamente, em vez de reagir a esses períodos de inatividade reiniciando os serviços ou o próprio servidor. Eu li sobre ferramentas de monitoramento como nagios, munin, cactos etc. para monitorar a saúde do seu servidor / infraestrutura, mas eu realmente não tentei um em produção. Lido com o Drupal quase 99% das vezes e gostaria de descobrir sugestões para o monitoramento no nível do servidor e o monitoramento no nível do Drupal (código do aplicativo).
Basicamente, eu gostaria de ser notificado quando a carga do servidor estiver alta, possivelmente sendo apontada para o culpado (ou a vítima), para que eu possa tomar decisões informadas. Também gostaria de saber o que as pessoas usam para o monitoramento de nível do Drupal (como email) quando houver um erro / aviso do PHP. (O que acontece quando o próprio servidor de email está inoperante?)