Geralmente, os textos introdutórios das estatísticas aplicadas distinguem a média da mediana (geralmente no contexto da estatística descritiva e motivam a sumarização da tendência central usando a média, a mediana e o modo), explicando que a média é sensível aos valores extremos nos dados da amostra e / ou para distorcer as distribuições populacionais, e isso é usado como justificativa para a afirmação de que a mediana deve ser preferida quando os dados não são simétricos.
Por exemplo:
A melhor medida de tendência central para um determinado conjunto de dados geralmente depende da maneira como os valores são distribuídos. ... Quando os dados não são simétricos, a mediana geralmente é a melhor medida de tendência central. Como a média é sensível a observações extremas, ela é puxada na direção dos valores dos dados
externos e, como resultado, pode acabar excessivamente inflada ou excessivamente desinflada. "- Pagano e Gauvreau, (2000) Principles of Biostatistics , 2a ed. (A P&G estava à mão, aliás, não as destacando por si só .)
Os autores definem "tendência central" assim: "A característica mais comumente investigada de um conjunto de dados é o centro ou o ponto sobre o qual as observações tendem a se agrupar".
Isso me parece uma maneira menos direta de dizer apenas usar a mediana, ponto final , porque apenas usar a média quando os dados / distribuições são simétricos é o mesmo que dizer usar apenas a média quando é igual à mediana. Edit: whuber corretamente aponta que estou confundindo medidas robustas de tendência central com a mediana. Portanto, é importante ter em mente que estou discutindo o enquadramento específico da média aritmética versus a mediana nas estatísticas introdutórias aplicadas (onde, por outro lado, outras medidas de tendência central não são motivadas).
Em vez de julgar a utilidade do meio pelo quanto ele se afasta do comportamento da mediana, não devemos simplesmente entendê-los como duas medidas diferentes de centralidade? Em outras palavras, ser sensível à assimetria é uma característica da média. Poder-se-ia argumentar com a mesma validade: "bem, a mediana não é boa porque é amplamente insensível à distorção; portanto, use-a apenas quando for igual à média".
(O modo sensivelmente não está se envolvendo com essa pergunta.)