O relatório do estado dos devops de 2017 diz que há uma taxa de falha de mudança de 31 a 45%. Embora isso pareça intuitivamente correto, eles são rastreados como incidentes? Nah. Porque eles são corrigidos rapidamente, geralmente durante a validação.
Um problema corrigido rapidamente ainda é um problema. Se você não está relatando isso como tal, isso é um problema.
Portanto, é preciso disciplina para relatar taxas de falha com precisão. Não estamos motivados a relatar assim, porque queremos que as coisas funcionem e fazemos o que é preciso para que isso aconteça.
Se seu objetivo é realmente fazer as coisas funcionarem, você precisa ser honesto sobre falhas, para poder evitá-las no futuro. Parece que a equipe aqui está mentindo (talvez para si próprios, certamente para a gerência) sobre falhas, porque seu objetivo é fazer com que as coisas pareçam estar funcionando.
Essas são coisas diferentes. Por exemplo, considere a velha piada de que o controle de qualidade produz bugs - "meu código estava bom até que o controle de qualidade o capturasse e depois eles fizeram todos esses bugs!". Os bugs estavam lá o tempo todo, mas o desenvolvedor os ignorava. O objetivo de uma equipe de operações deve ser a confiabilidade real , e eles precisam ser incentivados como tal por seus gerentes. Isso significa que, se eles implementarem mais monitoramentos que levem à descoberta de novos problemas, deverão ser recompensados, e não penalizados pela queda subsequente nas métricas de confiabilidade.
TL; DR, como você prova que os devops, especificamente a automação de implantação, melhoram as taxas de falha de alteração?
Se você está tentando motivar mudanças em sua organização, não deve tentar provar nada, mas forneça evidências do que outras organizações dizem sobre suas próprias transições. Se você estiver tentando medir os processos que você já possui e justificar sua existência contínua, deverá acompanhar as métricas de confiabilidade padrão, como tempo médio para reparo (MTTR).
Mas os princípios dos devops não se limitam a aumentar a confiabilidade. Mesmo a engenharia de confiabilidade do site não se limita a aumentar a confiabilidade. Em vez disso, você deseja obter um nível adequado de confiabilidade - algo que beneficia os negócios, mas não prejudica o desenvolvimento. E isso traz o verdadeiro motivador nos devops, que é capacitar a mudança . Você deseja permitir que a empresa responda mais rapidamente aos estímulos do mercado, o que ocorre diminuindo o atrito do desenvolvedor, aumentando a taxa de implantações, automatizando processos manuais etc., mantendo-se dentro de um limite aceitável de confiabilidade. Isso significa que você precisa medir a confiabilidade, mas também a velocidade, porque seu objetivo é aumentar o último, mantendo o primeiro relativamente estático.