Presumo que você esteja fazendo testes de unidade para o seu código.
Uma idéia em que posso pensar, que talvez não faria exatamente o que você quer, é usar um modelo linear.
O benefício de fazer isso é que você pode criar várias outras variáveis que pode incluir na análise.
Digamos que você tenha um vetor que inclua o resultado de seus testes e outro vetor que inclua suas previsões do resultado.xYx
Agora você pode simplesmente ajustar o modelo linear
yEu= a + b xEu+ ϵ
e encontre o valor debb , maior o valor de indicará que suas previsões estão melhorando.b
O que torna essa abordagem agradável é que agora você pode começar a adicionar várias outras variáveis para ver se isso cria um modelo melhor, e essas variáveis podem ajudar a fazer melhores previsões. As variáveis podem ser um indicador para o dia da semana, por exemplo, para segunda-feira, sempre será 1 e zero para todos os outros dias. Se você incluir essa variável no modelo, obterá:
yEu= a + aSegunda-feira+ b xEu+ ϵ
E se a variável umaSegunda-feira for significativa e positiva, isso pode significar que você é mais conservador em suas previsões às segundas-feiras.
Você também pode criar uma nova variável na qual atribui uma pontuação para avaliar a dificuldade da tarefa executada. Se você tiver controle de versão, poderá, por exemplo, usar o número de linhas de código como dificuldade, ou seja, quanto mais código você escrever, maior será a probabilidade de que algo ocorra.
Outras variáveis podem ser: número de xícaras de café naquele dia, indicador de prazos futuros, o que significa que há mais estresse para terminar as coisas, etc.
Você também pode usar uma variável de tempo para ver se suas previsões estão melhorando. Além disso, quanto tempo você gastou na tarefa, ou quantas sessões você gastou nela, se você estava fazendo uma solução rápida e pode ser desleixada etc.
No final, você tem um modelo de previsão, no qual pode tentar prever a probabilidade de sucesso. Se você conseguir criar isso, talvez nem precise fazer suas próprias previsões, basta usar todas as variáveis e adivinhar se as coisas vão funcionar.
O problema é que você só queria um número único. Nesse caso, você pode usar o modelo simples que apresentei no começo e apenas usar a inclinação e refazer os cálculos para cada período. Depois, é possível verificar se há uma tendência nessa pontuação ao longo do tempo.
Espero que isto ajude.