Temos 3 servidores dedicados, divididos em vários VPS usando openVZ. Estamos usando munin para monitorar o VPS com os locais de produção e monitorar alguns dos VPS para garantir que ele reinicie o serviço ao falhar.
O problema é que precisamos de uma maneira muito melhor de monitorar todos os nossos servidores, já que temos até 14 VPSes, gostaríamos de ter um hub central onde pudéssemos ver não apenas os dados coletados por munin, mas também algumas estatísticas extras nas redes e performances de nossos serviços.
Alguns de nossos requisitos:
- Notificação por SMS em caso de falha (capacidade de configurar determinadas verificações personalizadas)
- Analisador de log para o apache error_log e outros.
- Deve ser central (ou seja, um servidor e vários nós que coletam os dados).
- Não precisa ser fácil de instalar, mas fácil de manter.
- Precisa ser livre
Fui apontado para nagios e splunk, o que você acha? Obrigado,