Há uma boa razão para essas definições, que ficam mais claras quando você olha para a forma geral em busca de momentos de variáveis aleatórias padronizadas. Para responder a esta pergunta, em primeiro lugar considerar a forma geral do º padronizado momento central :n††
ϕn=E[(X−E[X]S[X])n ].
Os dois primeiros momentos centrais padronizados são os valores e , que são válidos para todas as distribuições para as quais a quantidade acima está bem definida. Portanto, podemos considerar os momentos centrais padronizados não triviais que ocorrem para os valores . Para facilitar nossa análise, definimos:ϕ1=0ϕ2=1n⩾3
ϕ+nϕ−n=E[∣∣∣X−E[X]S[X]∣∣∣n ∣∣∣X>E[X]]⋅P(X>E[X]),=E[∣∣∣X−E[X]S[X]∣∣∣n ∣∣∣X<E[X]]⋅P(X<E[X]).
Estes são quantidades não-negativos que dão o th absoluta de energia do condicional variável aleatória padronizados nela estar acima ou abaixo do seu valor esperado. Agora decomporemos o momento central padronizado nessas partes.n
Valores ímpares de medem a inclinação nas caudas:n para qualquer valor ímpar de , temos uma potência ímpar na equação do momento e, portanto, podemos escrever o momento central padronizado como . Deste forma, vemos que o momento central padronizado nos dá a diferença entre o º poder absoluto da variável aleatória padronizado, condicionada a que seja acima ou abaixo de sua média, respectivamente.n⩾3ϕn=ϕ+n−ϕ−nn
Assim, para qualquer potência ímpar , obteremos uma medida que fornece valores positivos se a potência absoluta esperada da variável aleatória padronizada for maior para valores acima da média do que para valores abaixo da média, e fornecer valores negativos se a expectativa a potência absoluta é menor para valores acima da média do que para valores abaixo da média. Qualquer uma dessas quantidades poderia razoavelmente ser considerada como uma medida de um tipo de "distorção", com potências mais altas atribuindo maior peso relativo a valores que estão longe da média.n⩾3
Como esse fenômeno ocorre para todas as potências ímpares , a escolha natural para uma medida arquetípica de "assimetria" é definir como a assimetria. Esse é um momento central padronizado mais baixo do que as potências ímpares mais altas, e é natural explorar momentos de ordem inferior antes da consideração de momentos de ordem superior. Em estatística, adotamos a convenção de nos referir a esse momento central padronizado como a assimetria , uma vez que é o menor momento central padronizado que mede esse aspecto da distribuição. (Os poderes ímpares mais altos também medem tipos de assimetria, mas com ênfase cada vez maior em valores distantes da média.)n⩾3ϕ3
Valoresn pares de medem a gordura das caudas: Para qualquer valor par de , temos uma potência par na equação do momento e, portanto, podemos escrever o momento central padronizado como . Deste forma, vemos que o momento central padronizado nos dá a soma do º poder absoluto da variável aleatória padronizado, condicionada a que seja acima ou abaixo de sua média, respectivamente.n⩾3ϕn=ϕ+n+ϕ−nn
Assim, para qualquer potência uniforme , obteremos uma medida que fornece valores não negativos, com valores mais altos ocorrendo se as caudas da distribuição da variável aleatória padronizada forem mais grossas. Observe que este é um resultado com relação à variável aleatória padronizada e, portanto, uma alteração na escala (alteração da variância) não afeta esta medida. Pelo contrário, é efetivamente uma medida da gordura das caudas, depois de padronizada para a variação da distribuição. Qualquer uma dessas quantidades poderia razoavelmente ser considerada como uma medida de um tipo de "curtose", com potências mais altas atribuindo maior peso relativo a valores que estão longe da média.n⩾3
Como esse fenômeno ocorre para todas as potências pares , a escolha natural para uma medida arquetípica de curtose é definir como a curtose. Esse é um momento central padronizado mais baixo do que as potências pares mais altas e é natural explorar momentos de ordem inferior antes da consideração de momentos de ordem superior. Em estatística, adotamos a convenção de nos referir a esse momento central padronizado como a "curtose", uma vez que é o menor momento central padronizado que mede esse aspecto da distribuição. (Os poderes pares mais altos também medem tipos de curtose, mas com ênfase cada vez maior em valores distantes da média.)n⩾3ϕ4
† Esta equação está bem definida para qualquer distribuição cujos dois primeiros momentos existam e que tenha variação diferente de zero. Assumiremos que a distribuição de interesse se enquadra nessa classe pelo restante da análise.