A curtose mede valores extremos. Os valores extremos são problemáticos para as inferências padrão (por exemplo, testes t, intervalos t) que são baseadas na distribuição normal. Esse é o fim da história! E é realmente uma história bastante simples.
A razão pela qual essa história não é bem apreciada é porque persiste o mito antigo de que a curtose mede "o pico".
Aqui está uma explicação simples que mostra por que a curtose mede valores extremos e não "pico".
Considere o seguinte conjunto de dados.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Curtose é o valor esperado de (valores-z) ^ 4. Aqui estão os (valores z) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
A média é 2,78, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)
Agora, substitua o último valor dos dados por 999 para que ele se torne um erro externo:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Agora, aqui estão os (valores z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
A média é 18,05, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)
Claramente, apenas os discrepantes são importantes. Nada sobre o "pico" ou os dados próximos ao meio é importante.
Se você executar análises estatísticas padrão com o segundo conjunto de dados, deverá esperar problemas. A curtose grande alerta você para o problema.
Aqui está um artigo que elabora:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.