Eu acho que a mediana média.
É esse o caso?
Eu acho que a mediana média.
É esse o caso?
Respostas:
É uma pergunta não trivial (certamente não tão trivial quanto as pessoas que fazem a pergunta parecem pensar).
A dificuldade é finalmente causada pelo fato de que realmente não sabemos o que queremos dizer com 'distorção' - muitas vezes é meio óbvio, mas às vezes não é. Dada a dificuldade de identificar o que queremos dizer com 'localização' e 'espalhar' em casos não triviais (por exemplo, a média nem sempre é o que queremos dizer quando falamos de localização), não deve ser uma grande surpresa que uma maneira mais sutil conceito como assimetria é pelo menos tão escorregadio. Portanto, isso nos leva a tentar várias definições algébricas do que queremos dizer, e elas nem sempre concordam entre si.
As versões de exemplo dessas estatísticas funcionam da mesma forma.
A razão para a necessária relação entre média e mediana nesse caso é porque é assim que a medida de assimetria é definida.
Aqui está uma densidade inclinada para a esquerda (pela segunda medida de Pearson e a medida mais comum em (2) abaixo):
A mediana é marcada na margem inferior em verde, a média em vermelho.
Então, espero que a resposta que eles querem que você dê é que a média é menor que a mediana. Geralmente é o caso dos tipos de distribuição a que costumamos dar nomes.
(Mas continue lendo e veja por que isso não está realmente correto como uma afirmação geral.)
2) Se você medi-lo no terceiro momento padronizado mais usual , geralmente é, mas nem sempre, o caso em que a média será menor que a mediana.
Ou seja, é possível construir exemplos onde o oposto é verdadeiro ou onde uma medida de assimetria é zero enquanto a outra é diferente de zero.
Ou seja, não é necessário relação entre os locais da média, mediana e a distorção do momento.
Considere, por exemplo, a seguinte amostra (o mesmo exemplo pode ser construído como uma distribuição de probabilidade discreta):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
No entanto, o coeficiente de assimetria (Fisher, terceiro momento) é negativo (ou seja, por suas luzes, temos dados de inclinação à esquerda), pois a soma dos cubos dos desvios da média é negativa.
Portanto, nesse caso, incline para a esquerda, mas média> mediana.
(Por outro lado, se você alterar 2,7 no exemplo acima para 3, terá um exemplo em que a inclinação do momento é zero, mas a média excede a mediana. Se você fizer 3,3, a inclinação do momento será positiva e a média excede a mediana - ou seja, está finalmente na direção "antecipada".)
Se você usar a primeira assimetria de Pearson em vez de uma das definições acima, você terá um problema semelhante a este caso - a direção da assimetria não identifica a relação entre média e mediana em geral.
Editar: em resposta a uma pergunta nos comentários - um exemplo em que a média e a mediana são iguais, mas a inclinação do momento é negativa. Considere os seguintes dados (como antes, também conta como exemplo para uma população discreta; considere escrever os números nas faces de um dado).
1 5 6 6 8 10
a média e a mediana são ambas 6, mas a soma dos cubos de desvios da média é negativa; portanto, a distorção do terceiro momento é negativa.
Não. Os dados inclinados à esquerda têm uma cauda longa à esquerda (extremidade inferior); portanto, a média geralmente será menor que a mediana. (Mas veja a resposta de @Glen_b para uma exceção). Casualmente, acho que os dados que "parecem" deixados distorcidos terão uma média menor que a mediana.
Dados inclinados à direita são mais comuns; por exemplo, renda. Lá, a média é maior que a mediana.
Código R
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001