Olhando para tentar criar alguma resiliência em nossa configuração Ansible, que trata de provisionamento e configuração.
Entendo alguns métodos de teste no lado da configuração, mas estou me perguntando qual a melhor forma de implementar o teste no lado do provisionamento e se existem ferramentas que possam ajudar nesse tipo de implementação.
Atualmente, muitos dos nossos testes são feitos em série durante o manual, o que faz muito sentido para coisas como "o serviço foi disponibilizado; o vip está disponível; a tarefa assíncrona foi concluída", mas o que realmente me preocupa é nossa capacidade de gerenciar desvios de informações. configuração na camada de aplicativo e provisionamento (como configuração da VM). Estou ciente de que o Ansible não é a melhor ferramenta para trabalhar com desvios de configuração, mas estou curioso para ver suas próprias opiniões.
Se você tem algo para automatizar totalmente o processo ainda melhor. (temos alguns scripts feios que relatam folga diariamente).
Nota : No momento, temos algumas condições em que uma reprovisão pode ocorrer (por exemplo, reconstrução a partir do backup, problema crítico nos sistemas), mas geralmente apenas percorre algumas das tarefas de configuração ansíveis e não pensa mais nisso.
I'm aware Ansible isn't the best tool for working with configuration drift
Por favor explique.