Quando é que a assimetria é uma coisa ruim? As distribuições simétricas (geralmente, mas nem sempre: por exemplo, não para a distribuição de Cauchy) têm mediana, modo e significam muito próximas umas das outras. Portanto, considere que, se queremos medir a localização de uma população, é útil ter a mediana, o modo e a média próximos um do outro.
em0 = - ∞
Exemplo de 25 rendimentos em dólares de quilo roubados do www.
k$ lnk$
28 3.33220451
29 3.36729583
35 3.555348061
42 3.737669618
42 3.737669618
44 3.784189634
50 3.912023005
52 3.951243719
54 3.988984047
56 4.025351691
59 4.077537444
78 4.356708827
84 4.430816799
90 4.49980967
95 4.553876892
101 4.615120517
108 4.682131227
116 4.753590191
121 4.795790546
122 4.804021045
133 4.890349128
150 5.010635294
158 5.062595033
167 5.117993812
235 5.459585514
A assimetria da primeira coluna é 0,99 e a segunda é -0,05. A primeira coluna não é provavelmente normal (Shapiro-Wilk p = 0,04) e a segunda não é significativamente normal (p = 0,57).
First column Mean 90.0 (95% CI, 68.6 to 111.3) Median 84.0 (95.7% CI, 52.0 to 116.0)
Second col Exp(Mean) 76.7 (95% CI, 60.2 to 97.7) Exp(Median) 84.0 (95.7% CI, 52.0 to 116.0)
exp[ média em( k $ ) ] de 76,7 k, que é menor que a mediana, também é mais razoável como estimativa?
Obviamente, o log-normal aqui é um modelo melhor e o logaritmo médio nos fornece uma melhor medida de localização. O fato de isso ser bem conhecido, se não totalmente compreendido, é ilustrado pela frase "Antecipo receber um salário de cinco dígitos".