Outras pessoas sugerem o envio de mensagens regulares dizendo que tudo está bem, mas pessoalmente não concordo com isso. O monitoramento deve ser silencioso, a menos que haja um problema, e nunca se deve confiar em que um usuário perceba que algo está errado, como "Ah, eu não recebo esse email diariamente há alguns dias". Especialmente se você tiver mais de uma pessoa respondendo a alertas, cada uma pode pensar que a outra já removeu a mensagem diária "Estou bem".
Temos um serviço externo (dos quais existem centenas, mas usamos wormly ) para fazer verificações HTTP do nosso servidor de monitoramento para garantir que ele funcione e possa acessar a Internet. Essa é a nossa principal preocupação em monitorá-lo. Em seguida, nosso servidor Nagios monitora todos os servidores Nagios de nossos clientes.
Mas você traz um bom argumento. Provavelmente, devemos adicionar uma URL HTTP que verifique a fila de postfix e, se ela mostrar um número incomum de mensagens, o que provavelmente significa que ela tem alguma na fila, em seguida, gere um alerta. Outra opção seria usar métodos diferentes para alertas, digamos, um agente de entrega de SMS não SMTP e SMTP que usamos atualmente.
No entanto, no nosso caso, não me lembro que já tivemos o servidor de correio morto. Obviamente, todo esse servidor de email é usado para enviar alertas do Nagios, portanto a configuração é muito simples e quase nunca muda.