Como determinar a eficácia de um processo de revisão de código?

Introduzimos um processo de revisão de código em nossa organização e parece estar funcionando bem. No entanto, eu gostaria de poder medir a eficácia do processo ao longo do tempo, ou seja, não estamos encontrando bugs porque o código é limpo ou as pessoas simplesmente não estão percebendo bugs?

Atualmente, não temos um processo de teste totalmente automatizado eficaz. Empregamos principalmente testes manuais, portanto não podemos confiar nos defeitos encontrados neste estágio para garantir que o processo de revisão de código esteja funcionando.

Alguém já se deparou com esse problema antes ou pensa sobre o que funciona bem na medição de revisões de código?

— Johnv2020
fonte

Encontrar bugs não é o único objetivo das revisões de código. Eles também são úteis para reforçar padrões de codificação, cross-training, polinização cruzada de idéias e tecnologias, etc

— Jason

Graças Jason & entendido, no entanto, neste caso, eu estou tentando descobrir como para assegurar que o processo atinge seu núcleo objetivo de prevenção de defeitos, como no início do processo dev possível

@ Johnv2020 Esse não é o seu objetivo principal ... Você perde completamente o objetivo de uma revisão de código. Isso seria como colocar um ótimo novo recurso de segurança em uma frota de aviões a jato e tentar avaliar sua eficácia com base no número de acidentes. Existem muitas variáveis e outros fatores a serem considerados para afirmar com precisão que o recurso de segurança melhorou as chances de um acidente não ocorrer.

— maple_shaft

@ maple_shaft: analogia fraca. Tentar medir as taxas de bugs é mais como tentar medir o número de caixões usados por pessoas mortas devido a acidentes.

— S.Lott

Em todas as revisões de código que participei, muitos bugs já foram corrigidos nos testes de unidade e de nível superior. Ou seja, o código não está pronto para revisão apenas porque é compilado.

— Pete Wilson

Respostas:

Há várias métricas que podem ser coletadas a partir de análises de código, algumas até estendendo-se ao longo do ciclo de vida do projeto.

A primeira métrica que eu recomendaria reunir é a eficácia da remoção de defeitos (DRE) . Para cada defeito, você identifica em que fase o defeito foi introduzido e em que fase foi removido. As várias técnicas de detecção de defeitos usadas são todas avaliadas simultaneamente, de modo que se aplica igualmente a análises de requisitos, análises de projeto, análises de código, testes de unidade , e assim por diante. Você estaria particularmente interessado no número de defeitos detectados na fase do código, pois isso provavelmente abrangeria seus testes de unidade e análises de código. Se muitos defeitos da fase de código estiverem chegando à fase de teste de integração ou mesmo ao campo, você saberá que as práticas de pós-codificação devem ser avaliadas.

Várias métricas de reunião também seriam relevantes. Isso inclui o tempo de preparação, o tempo de reunião, as linhas de leitura de código, os defeitos encontrados na revisão e assim por diante. Algumas observações podem ser feitas a partir desses dados. Como exemplo, seria se seus revisores estivessem gastando muito tempo lendo o código em preparação para a revisão, mas encontrando muito poucos problemas. Juntamente com os dados do DRE, você pode concluir que se os defeitos estiverem sendo testados nos testes de integração ou no campo, sua equipe precisará se concentrar nas técnicas de revisão para encontrar problemas. Outra observação interessante seria as linhas de código (ou alguma outra medida de tamanho) lidas em uma reunião em comparação com o horário da reunião. A pesquisa descobriu que a velocidade de uma revisão de código típica é de 150 linhas de código por hora.

Com qualquer uma dessas métricas, é importante entender seu impacto no processo. A análise de causa raiz, usando técnicas como o porquê, porque , os diagramas de Cinco Porquês ou Ishikawa podem ser usados para identificar os motivos pelos quais as revisões de código (ou qualquer outra técnica de melhoria de qualidade) são (in) efetivas.

Você também pode estar interessado neste artigo sobre inspeções do The Ganssle Group e em um artigo de Capers Jones no Crosstalk sobre Potenciais de Defeitos e DRE .

— Thomas Owens
fonte

Embora em grande parte seja verdade que a revisão de código identificaria problemas bastante latentes que os testes podem ou não detectar. No entanto, na minha opinião, você pode ter um código realmente estável (praticamente livre de bugs), mas ainda assim escrito de tal maneira que é extremamente ilegível ou pouco sustentável. Portanto, pode ser que a revisão do código NÃO encontre erros se realmente não houver problemas reais no código.

Dito isto, eu realmente perguntaria, por que alguém iria querer fazer uma revisão de código? A simples razão pela qual é importante é que o código deve ser aprimorado para se tornar mais legível, sustentável e evolutível. Muitas pessoas devem ser capazes de ler códigos mais limpos e fazer sentido com isso. Nesse sentido, o objetivo mais simples do processo de revisão de código é produzir código limpo. Portanto, a medida de eficácia é o quão mais limpo o código é agora.

Como você queria ter uma eficácia mensurável - eis o que eu sugeriria:

Métrica relacionada à quantidade de retrabalho - O número de vezes que o retrabalho é aplicado em um mesmo módulo / objeto / item de trabalho é uma medida de quão pobre é esse código em termos de manutenção. Quando uma revisão de código eficaz é aplicada, com que frequência podemos reduzir a solicitação de retrabalho no mesmo módulo?
Métrica relacionada à quantidade de mudança em que cada solicitação de mudança incorre. Quando toda vez que uma solicitação de mudança ocorre - um código mal fatorado sempre terá um número maior de módulos afetados. Uma medida provavelmente indica que após uma revisão de código - houve alguma redução dessa propagação de mudança para uma solicitação de mudança semelhante no passado?
Métrica relacionada à velocidade média com a qual uma solicitação de mudança pode ser respondida. Quando o código é mais limpo - mais rápido e melhor, é para responder às alterações necessárias. Depois que o código foi limpo no processo de revisão, encontramos uma velocidade maior na resposta à solicitação de tamanho semelhante.

Não estou colocando unidades exatas de medidas - você provavelmente pode criar medidas mais precisas sobre isso a partir dessa abordagem. Pode haver mais formalismo de extensão nas abordagens acima sobre isso.

Basicamente, meu argumento é que, em vez de analisar o número de bugs que o processo de revisão de código identifica; devemos medir a eficácia em termos de se a revisão de código foi capaz de trazer o código para um estado mais limpo, mais enxuto e fácil de manter; portanto, podemos avaliar essa eficácia se percebermos que solicitações de mudança semelhantes no futuro se tornam mais eficientes para serem respondidas.

— Dipan Mehta
fonte

Embora não seja um "bug", a falta de legibilidade, capacidade de manutenção ou capacidade de evoluir é um defeito no código e deve ser tratado como tal. Não há razão para que eles não possam ser rastreados em um rastreador de defeitos, junto com erros reais na funcionalidade. Ao fazer isso, você também abre a capacidade de rastrear várias outras métricas relacionadas a defeitos na fase de codificação.

— Thomas Owens

Como desenvolvedor, com certeza gostaria de ver um código limpo. No entanto, as revisões de código são muito caras. Portanto, como gerente que financia um projeto, o código limpo não é realmente um motivo convincente para adicionar de 5 a 10% em custos e tempo ao meu orçamento de desenvolvimento. Especialmente quando (como gerente) meu bônus / revisão está vinculado à conclusão do projeto atual dentro do prazo / dentro do orçamento. Portanto, sua opinião de que o principal motivo das análises de código é obter um código limpo faria qualquer bom gerente dizer que o ROI não vale a pena. Você pode discutir sobre retornos de longo prazo, mas, em seguida, o gerente que entrega on-time / on-orçamento terá sido promovido longe do que prov

— Dunk

...problema. Enquanto o gerente que promoveu as revisões de código terá projetos de manutenção bem-sucedidos, mas terá sido preparado para não concluir o projeto original dentro do prazo / dentro do orçamento, como o gerente que não o fez. OTOH, se as revisões de código ajudaram a encontrar erros que a falta de revisão não permitiu e que o gerente de revisão de código conclua seu projeto mais dentro do prazo / orçamento, então é uma história diferente. Essa é a história que precisa ser vendida. O que também significa que o código limpo não pode ser o motivo das revisões de código.

— Dunk

@ Dunk O custo de uma revisão de código depende do tipo de revisão de código. Uma inspeção formal com 3-5 leitores, um moderador e a presença do autor (5-7 pessoas em uma sala) é cara. Uma verificação de mesa que consiste em outro desenvolvedor que olha o código por 10 a 15 minutos também é uma revisão de código, mas muito menos formal e muito mais barata. Até a programação de pares pode ser considerada uma espécie de técnica de "revisão de código". A técnica apropriada é determinada por fatores que incluem (mas não se limitam a) a criticidade do código, a taxa de defeitos desejada e a quantidade de tempo / dinheiro a ser investido.

— Thomas Owens

@ Dunk - Eu acho que você argumentou por tomar a decisão "devemos codificar revisão" das mãos do gerente de projetos e colocá-las nas mãos do gerente responsável pela plataforma de software a longo prazo. A IMO, de um modo geral, gastar 5 a 10% a mais em desenvolvimento para análises decentes de código é um investimento que vale a pena em termos de longevidade do sistema que está sendo desenvolvido. Mas provavelmente não em termos de orçamento e cronograma do projeto atual.

— Dawood diz que restabelece Monica