Eu acho que um teste de corrida é uma boa ideia. Para mim, analisando os dados em "chunks", sua intenção é criar um proxy ou controle para "mãos quentes" na consistência do jogador. Há uma enorme literatura sobre esse fenômeno por aí. Um dos melhores artigos foi discutido por Gelman em seu blog em julho de 2015. O título de seu post era "Ei, adivinhem? Há realmente uma mão quente!" ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). O artigo de Gelman é uma refutação de grande parte da literatura anterior, na medida em que detalha os erros cometidos pelas análises anteriores do fenômeno das mãos quentes. O trabalho anterior se concentrou nas probabilidades gerais, em oposição às condicionais. Este artigo apresenta um novo modelo de probabilidade seqüencial (consulte o link para uma referência ao artigo).
Uma boa métrica de consistência que deve controlar as diferenças em, por exemplo, número de fotos tiradas, é o coeficiente de variação. O CV é uma medida de variabilidade invariável e sem dimensão da escala e é calculado dividindo o desvio padrão pela média. O problema que ele tenta resolver é que os desvios padrão são expressos na escala da unidade sob medida, ou seja, não é invariável na escala. Isso significa que as métricas com altos valores médios também tendem a ter desvios mais altos do que as métricas com baixos valores médios. Assim, por exemplo, devido às diferenças em seus valores médios, as medidas da variabilidade da pressão arterial diastólica e sistólica não são diretamente comparáveis. Ao fazer o currículo, sua variabilidade se torna comparável. O mesmo vale para muitas outras métricas, como preços das ações,
Assim, o CV pode ser calculado para muitas métricas e tipos de escala, excluindo informações categóricas e medidas com valores negativos.