Eu sei que isso deve ser apenas uma falta de entendimento, mas aqui está o problema.
Recentemente, alteramos os servidores DNS de 192.168.1.1 para .2, então eu passei pelos 8 servidores linux e alterei o /etc/resolv.conf para refletir a alteração. Observe que eles são todos estáticos, não há DHCP envolvido.
Depois de fazer a alteração, posso testar imediatamente os resultados usando nslookup e dig, e tudo fica bem. Fiz uma reinicialização do /etc/init.d/networking - para reiniciar o subsistema de rede - e reiniciei o apache e o postfix em cada um dos servidores, apenas para ter certeza.
Alguns dias depois, recebo um relatório informando que nossos sites não estão mais enviando e-mails. Examinando os logs, descobri que o processo mod_php não conseguia resolver as entradas DNS para enviar email. Depois de bater minha cabeça por cerca de 30 minutos, reiniciei o servidor e tudo voltou ao normal.
No dia seguinte, em um servidor diferente (usando o CentOS em vez do Ubuntu normal), recebo um relatório informando que os emails não estão sendo enviados e, com certeza, olhando os logs indica que o Postfix não pode resolver nomes. Reinicializado e entrega quase instantaneamente todas as mensagens em fila.
Então, o que estou perdendo aqui? Que parte desse processo não entendi corretamente?