O link em questão também fala sobre SAS. Mas, na verdade, nada nesta questão, exceto possivelmente o próprio foco do pôster, o limita a esses programas nomeados em particular.
Penso que precisamos separar aqui tipos de problemas bastante diferentes, alguns dos quais são ilusórios e outros genuínos.
Alguns programas subtraem 3, de modo que a medida da curtose relatada é 3 para variáveis gaussianas / normais sem subtração e 0 com subtração. Eu já vi pessoas intrigadas com isso, muitas vezes quando a diferença acaba sendo 2,9999 e não exatamente 3.
Alguns programas usam fatores de correção projetados para garantir que a curtose seja estimada sem viés. Esses fatores de correção se aproximam de 1 quando o tamanho da amostra aumenta. Como a curtose não é bem estimada em pequenas amostras, isso não deve ser motivo de grande preocupação.n
Portanto, há um pequeno problema de fórmulas, sendo o número 1 um negócio muito maior que o número 2, mas ambos menores, se compreendidos. O conselho é claramente examinar a documentação do programa que você está usando e, se não houver documentação explicando esse tipo de detalhe, abandone o programa imediatamente. Mas um caso de teste tão simples quanto uma variável (1, 2) produz curtose de 1 ou 4, dependendo apenas do número 1 (sem fator de correção).
A pergunta então é sobre interpretação, mas esse é um assunto muito mais aberto e controverso.
Antes de chegarmos à principal área de discussão, uma dificuldade frequentemente relatada, mas pouco conhecida, é que as estimativas de curtose são limitadas em função do tamanho da amostra. Escrevi uma resenha em Cox, NJ 2010. Os limites da distorção e curtose da amostra. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Resumo: A assimetria e curtose da amostra são limitadas por funções do tamanho da amostra. Os limites, ou aproximações a eles, foram repetidamente redescobertos nas últimas décadas, mas, no entanto, parecem permanecer apenas pouco conhecidos. Os limites conferem viés à estimativa e, em casos extremos, implicam que nenhuma amostra poderia dar testemunho exato de sua distribuição-mãe. Os principais resultados são explicados em uma revisão tutorial e é mostrado como Stata e Mata podem ser usados para confirmar e explorar suas conseqüências.
Agora, para o que é comumente considerado como o cerne da questão:
Muitas pessoas traduzem a curtose como pico, mas outras enfatizam que muitas vezes serve como uma medida do peso da cauda. De fato, as duas interpretações podem ser palavras razoáveis para algumas distribuições. É quase inevitável que não haja uma interpretação verbal simples da curtose: nossa linguagem não é rica o suficiente em comparações de somas do quarto poder de desvio da média e somas de segundos poderes do mesmo.
Em um clássico menor e muitas vezes esquecido, Irving Kaplansky (1945a) chamou a atenção para quatro exemplos de distribuições com diferentes valores de curtose e comportamento não consistentes com algumas discussões sobre curtose.
As distribuições são todos simétricos com média e variância 0 1 e tem funções de densidade, para a variável e ,xc=π−−√
(1) (1/3c)(9/4+x4)exp(−x2)
(2) (3/(c8–√))exp(−x2/2)−(1/6c)(9/4+x4)exp(−x2)
(3) (1/6c)(exp(−x2/4)+4exp(−x2))
(4) (33–√/16c)(2+x2)exp(−3x2/4)
A curtose (sem subtração) é (1) 2,75 (2) 3,125 (3) 4,5 (4) 8/3 2.667: compare o valor gaussiano ou normal de 3. A densidade média é (1) 0,423 (2) ) 0,387 (3) 0,470 (4) 0,366: compare o valor gaussiano de 0,399.≈
É instrutivo traçar essas densidades. Os usuários do Stata podem baixar meu kaplansky
programa no SSC. Usar uma escala logarítmica para densidade pode ajudar.
Sem revelar todos os detalhes, esses exemplos minam qualquer história simples de que a curtose baixa ou alta tenha uma interpretação clara em termos de pico ou mesmo qualquer outro contraste isolado.
Se o nome Irving Kaplansky toca, provavelmente é porque você conhece o trabalho dele na álgebra moderna. Ele (1917-2006) era um matemático canadense (mais tarde americano) e ensinou e pesquisou em Harvard, Chicago e Berkeley, com um ano de guerra no Grupo de Matemática Aplicada do Conselho de Defesa Nacional da Universidade de Columbia. Kaplansky fez grandes contribuições à teoria dos grupos, teoria dos anéis, teoria das álgebras dos operadores e teoria dos campos. Ele era um pianista e letrista talentoso e um expositor entusiasmado e lúcido da matemática. Observe também algumas outras contribuições de probabilidade e estatística de Kaplansky (1943, 1945b) e Kaplansky e Riordan (1945).
Kaplansky, I. 1943. Uma caracterização da distribuição normal. Annals of Mathematics Statistics 14: 197-198.
Kaplansky, I. 1945a. Um erro comum em relação à curtose. Journal, American Statistical Association 40: 259 apenas.
Kaplansky, I. 1945b. A distribuição assintótica de execuções de elementos consecutivos. Annals of Mathematics Statistics 16: 200-203.
Kaplansky, I. e Riordan, J. 1945. Correspondência múltipla e é executada pelo método simbólico. Annals of Mathematics Statistics 16: 272-277.