Existem equivalentes normalizados para Skewness e Kurtosis?


10

Qual seria o equivalente normalizado ao Skewness que teria a mesma unidade que os dados? Da mesma forma, qual seria o equivalente normalizado à curtose? Idealmente, essas funções devem ser lineares com relação aos dados, o que significa que, se todas as observações fossem multiplicadas por um fator n, a assimetria normalizada e a curtose resultantes seriam multiplicadas pelo mesmo fator n. O benefício de ter esses equivalentes normalizados seria poder cobri-los sobre um gráfico padrão de caixa e bigode.


Que pergunta divertida!
Alexis12

Não tenho certeza de quão esclarecedor seria ilustrá-las nos gráficos. A razão pela qual ilustramos os desvios-padrão é que eles fornecem uma medida natural da dispersão dos dados (se normalmente são distribuídos): 65% das observações ficam dentro do intervalo. Eu não acho que haja interpretações visuais naturais para o terceiro e quarto momentos.
Ben Kuhn

2
O que você está tentando mostrar sobre seus dados? Se é um certo comportamento qualitativo da distribuição, uma trama de violino pode ser preferível? Mas sim, enfim, é uma pergunta divertida.
Ben Kuhn

Pode-se ter uma sensação de assimetria e curtose observando um histograma mostrando a distribuição do conjunto de dados, mas fornecerá uma percepção muito subjetiva dessas medidas. Gostaria de descrevê-los em duas escalas lineares, uma para distorção paralela ao eixo do gráfico de caixa e bigode, a outra ortogonal a ele. Isso pode ser representado como uma caixa separada sobreposta à caixa principal. Quanto mais alta a caixa, mais inclinados são os dados. Quanto maior, mais pontudo (alta curtose).
Ismael Ghalimi

E obrigado pelo link para a trama violon. É realmente inteligente.
Ismael Ghalimi

Respostas:


10

As medidas de assimetria são deliberadamente sem unidade .

A distorção de momento usual é um terceiro momento padronizado, .E[(Xμσ)3]

Se você centraliza, mas não padroniza, você tem ... que é claramente então em unidades em cubos .μ3=E[(Xμ)3]

Se você quisesse algo nas mesmas unidades que , teria que pegar a raiz do cubo, da mesma forma que pegamos a raiz quadrada de variação e obtivemos algo nas mesmas unidades dos dados originais. (No entanto, cuidado, porque muitos pacotes não têm raízes negativas em números negativos, você pode calculá-lo como: )Xsign(Xμ)×|E(Xμ)3|1/3

Não tenho certeza de quão útil isso será.

Para algumas outras medidas de assimetria, como as duas medidas de assimetria de Pearson, você apenas multiplica por .σ

Para medidas de assimetria da amostra em que e geralmente não são conhecidos, como na assimetria da amostra, você normalmente as substitui por suas próprias estimativas de amostra.σμ

A curtose segue o mesmo padrão - para curtose momentânea, é necessário criar a quarta raiz do quarto momento não padronizado para obter algo que seja escalonado com os dados.

Para algumas das outras medidas de curtose, elas só precisariam ser multiplicadas por .σ


10

A assimetria e curtose são características da forma. Então, se eu lhe disser que a coisa, uma bola, é redonda , não importa o raio da coisa. Pode ser uma bola pequena ou uma bola grande . Por outro lado, quando digo bola pequena ou cubo grande , estou me referindo ao tamanho do objeto, não à forma.

Nesse sentido, o desvio padrão é o tamanho da distribuição, e é por isso que a assimetria e a curtose são normalizadas pelo tamanho. Você também pode dizer que o desvio padrão pertence à mecânica, assimetria e curtose à geometria. Portanto, não, não precisamos tê-los em unidades de medida da variável. Tamanho e forma são separados. Uma bola grande e uma pequena são igualmente redondas , ou seja, o tamanho não importa neste caso :)


1

Denotando vetores distribuídos na região , vamos assumir o zeroth e o primeiro momento já está normalizado. O segundo momento é calculado com, portanto, se pudermos encontrar a diagonalização , poderemos definir para que seja normalizado:RM2=RxxT|dx|M2=PΛ2PT

x=Λ1PTx
M2

M2ij=R(Λ1PTx)(Λ1PTx)T|dx|
=Λ1PT(RxxT|dx|)PΛ1
=Λ1PTPΛ2PTPΛ1=I

O significado geométrico do segundo momento é "orientação", justificado pelo fato de que a diagonalização normaliza o segundo momento. Quando a assimetria é calculada sob essa normalização, ela é denominada assimetria de Mardia .

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.