Explicando a média, a mediana e o modo nos termos do leigo


10

Como você explicaria o conceito de média, mediana e modo de uma lista de números e por que eles são importantes para alguém com apenas habilidades aritméticas básicas? Não vamos mencionar assimetria, CLT, tendência central, suas propriedades estatísticas, etc.

Expliquei a alguém que isso significa apenas uma maneira rápida e suja de "resumir" uma lista de números. Mas, olhando para trás, isso dificilmente é esclarecedor.

Quaisquer pensamentos ou exemplos do mundo real?


Eles são "tendência central", também conhecida como "resultado mais provável" em diferentes domínios. Intensidade, ordem e frequência, em particular. O mundo real também tem variação - portanto, coisas como desvio padrão, intervalo interquartil (ou quantil) e intervalo intermodal também são bastante úteis porque indicam "tendência de variação" ou "variação típica nos resultados".
EngrStudent

Você pode dar um exemplo de que há uma máquina gerando números aleatoriamente. Você coleta todos os números gerados em uma lista. Agora você deseja apresentá-lo aos seus amigos sem citar todos os números da lista. Assim, você procura medidas que possam ajudá-lo a descrevê-lo. Média / Mediana / Modo são três medidas semelhantes que fornecem informações sobre as propriedades básicas da máquina.
Kevin Pei

@KevinPei Mas o que significa "significa" neste caso? Média / Mediana / Modo não explica muito em um exemplo artificial e independente.
31516 Concerted_Citizen

11
Encontrar média é um problema de encontrar o ponto de pivô que equilibra a gangorra depois que as crianças (do mesmo peso) embarcam nela em número arbitrário e em posições arbitrárias na viga. Encontrar mediana é a mesma tarefa, diz-se que apenas as crianças se agrupam em apenas duas posições, desse lado "ou" deste lado.
ttnphns

Você não pode explicar isso sem a noção de distribuição. Com apenas habilidades aritméticas básicas, você precisa desenhar.
Aksakal

Respostas:


6

Obrigado por esta pergunta simples, porém profunda, sobre os conceitos estatísticos fundamentais de média, mediana e modo. Existem alguns métodos / demonstrações maravilhosos disponíveis para explicar e compreender um entendimento intuitivo - e não aritmético - desses conceitos, mas infelizmente eles não são amplamente conhecidos (ou ensinados na escola, pelo que sei).

Significar:

1. Ponto de Equilíbrio: Média como ponto de apoio

A melhor maneira de entender o conceito de fazê-lo pensar nele como o ponto de equilíbrio em uma haste uniforme. Imagine uma série de pontos de dados, como {1,1,1,3,3,6,7,10}. Se cada um desses pontos estiver marcado em uma haste uniforme e pesos iguais forem colocados em cada ponto (como mostrado abaixo), o ponto de apoio deve ser colocado na média dos dados para a haste se equilibrar.

insira a descrição da imagem aqui

Essa demonstração visual também leva a uma interpretação aritmética. A lógica aritmética para isso é que, para o equilíbrio do ponto de apoio, o desvio negativo total da média (no lado esquerdo do ponto de apoio) deve ser igual ao desvio positivo total da média (no lado direito). Portanto, a média atua como ponto de equilíbrio em uma distribuição.

Este visual permite uma compreensão imediata da média no que se refere à distribuição dos pontos de dados. Outra propriedade da média que se torna facilmente aparente a partir desta demonstração é o fato de que a média sempre estará entre os valores mínimo e máximo na distribuição. Além disso, o efeito de outliers pode ser facilmente entendido - que a presença de outliers mudaria o ponto de equilíbrio e, portanto, afetaria a média.

2. Valor da redistribuição (participação justa)

Outra maneira interessante de entender a média é pensar nela como um valor de redistribuição . Essa interpretação requer alguma compreensão da aritmética por trás do cálculo da média, mas utiliza uma qualidade antropomórfica - a saber, o conceito socialista de redistribuição - para compreender intuitivamente o conceito de média.

O cálculo da média envolve somar todos os valores em uma distribuição (conjunto de valores) e dividir a soma pelo número de pontos de dados na distribuição.

x¯=(Eu=1 1nxEu)/n

Uma maneira de entender a lógica por trás desse cálculo é pensar em cada ponto de dados como maçãs (ou algum outro item fungível). Usando o mesmo exemplo de antes, temos oito pessoas em nossa amostra: {1,1,1,3,3,6,7,10}. A primeira pessoa tem uma maçã, a segunda pessoa tem uma maçã e assim por diante. Agora, se alguém quiser redistribuir o número de maçãs de forma que seja "justo" para todos, você pode usar a média da distribuição para fazer isso. Em outras palavras, você pode dar quatro maçãs (ou seja, o valor médio) a todos para que a distribuição seja justa / igual. Esta demonstração fornece uma explicação intuitiva para a fórmula acima: dividir a soma de uma distribuição pelo número de pontos de dados é equivalente a particionar toda a distribuição igualmente para todos os pontos de dados.

3. Mnemônicos Visuais

As seguintes mnemônicas visuais fornecem a interpretação da média de uma maneira única:

insira a descrição da imagem aqui

Este é um mnemônico para a interpretação do valor de nivelamento da média. A altura da barra transversal do A é a média das alturas das quatro letras.

insira a descrição da imagem aqui

E este é outro mnemônico para a interpretação do ponto de equilíbrio da média. A posição do ponto de apoio é aproximadamente a média das posições do M, E e duplicou N.

Mediana

Uma vez entendida a interpretação da média como o ponto de equilíbrio em uma haste , a mediana pode ser demonstrada por uma extensão da mesma idéia: o ponto de equilíbrio em um colar .

Substitua a haste por uma corda, mas mantenha as marcações e pesos dos dados. Em seguida, nas extremidades, prenda uma segunda corda, mais longa que a primeira, para formar um laço [como um colar] e passe o laço sobre uma polia bem lubrificada.

insira a descrição da imagem aqui

Suponha, inicialmente, que os pesos sejam distintos. A polia e o loop se equilibram quando o mesmo número de pesos está em cada lado. Em outras palavras, o loop 'equilibra' quando a mediana é o ponto mais baixo.

Observe que, se um dos pesos for deslizado até o loop, criando um outlier, o loop não se moverá. Isso demonstra fisicamente o princípio de que a mediana não é afetada pelos valores discrepantes.

Modo

O modo é provavelmente o conceito mais fácil de entender, pois envolve a operação matemática mais básica: contagem. O facto de que é igual aos que ocorrem mais frequentemente ligações de ponto de dados para uma sigla: “ M ost-frequentemente O ccurring D ATA E lement”.

O modo também pode ser pensado no valor mais típico de um conjunto. (Embora uma compreensão mais profunda de 'típico' leve ao representante, ou valor médio. No entanto, é apropriado equiparar 'típico' ao modo com base no significado literal da palavra 'típico'.)


Fontes:

  • A mediana é um ponto de equilíbrio - Lynch, The College Mathematics Journal (2009)
  • Tornando as Estatísticas Memoráveis: Novos Mnemônicos e Motivações - Menor, Educação Estatística, JSM (2011)
  • Sobre o uso de mnemônicos para ensino de estatística - estatística e aplicações assistidas por modelo, 6 (2), 151-160 (2011)
  • O que significa o significado? - Watier, Lamontagne e Chartier, Revista de Educação Estatística, Volume 19, Número 2 (2011)
  • Típica? Ideias sobre crianças e professores sobre a média - Russell e Mokros, ICOTS 3 (1990) REFERÊNCIA GERAL: http://www.amstat.org/publications/jse/v22n3/lesser.pdf

Apenas me deparei com este artigo de hoje que lança um pouco mais luz sobre este: priceonomics.com/how-the-average-triumphed-over-the-median
Vishal

11
Um usuário anônimo também sugeriu a seguinte referência geral: amstat.org/publications/jse/v22n3/lesser.pdf
gung - Reinstate Monica

3

Tenho que me perguntar se seus critérios são alcançáveis, pois você parece querer a máxima eficácia e poder explicativo com o mínimo de materiais. Mas um exemplo simples como

1 1 2 2 2 3 3 4 5 6 15

permite o cálculo imediato do modo (2), da mediana (3) e da média (44/11) = 4 e, portanto, mostra que eles podem ser diferentes.

Você poderia então explicar que as idéias do valor mais comum, o valor no meio e a média são diferentes. E introduza complicações por

  1. alterar valores para mostrar o modo pode ser ambíguo

  2. usando um exemplo com um número par de valores para explicar a convenção para calcular a mediana

  3. valores variáveis ​​nas caudas para enfatizar o que acontece com a média, e por que e por que não isso pode ser desejável.

  4. usando exemplos mais simples nos quais dois ou três modos médio, mediano e coincidem.

Não mencionei a tendência central em meus ensinamentos, exceto para dizer que é um termo em várias literaturas. Eu prefiro falar sobre o nível e como ele pode ser quantificado. Por outro lado, não acho que seja possível uma análise séria dos dados, a menos que as pessoas tenham uma sensação mínima de distorção mais usual do que simetria.


Sim, o ajuste dos valores alterará as estatísticas de resumo, mas o que significa "significa" por si só?
Concerned_Citizen

11

11
O que é vermelho ? Nem sempre precisamos conhecer definições para usar idéias. Uma boa compreensão do vermelho provavelmente requer física, fisiologia e psicologia, mas eu nunca precisei disso. Sei muito sobre como a média funciona, mas em um nível fundamental sua definição é apenas sua fórmula.
Nick Cox

11
@NickCox muito justo e muito verdadeiro. mas a minha experiência na faculdade ainda é bastante recente, e eu me lembro de muitos problemas onde eu cegamente calculados uma resposta sem entender o que eu calculada ou por que fiz isso
shadowtalker

11
@ssdecontrol Isso não é nunca parar de acontecer completamente ...
Nick Cox

3

É assim que eu os explico:

A média (aritmética) é o ponto que leva em consideração todo o conjunto de dados e se instala em algum lugar "no meio". Faça-os pensar em uma nuvem de pontos, ou uma bolha, no espaço: a média é o centro de massa dessa nuvem de pontos.

A mediana é o ponto que tem "o mesmo número de pontos em todos os lados" (onde obviamente o conceito de "lado" não está bem definido em mais de duas dimensões). Isso representa outro tipo de "meio" e, de fato, um tipo mais intuitivo em algum sentido. Pensando no mesmo blob no espaço, fica claro que, se o blob for desequilibrado, a média será alterada. Mas essa desigualdade pode ser alcançada de duas maneiras: você adiciona mais pontos em uma área ou aumenta a dispersão de pontos nessa área. Se você aumentar a dispersão de pontos em uma área sem aumentar o número de pontos, a mediana ainda terá o mesmo número de pontos "em todos os lados" e não mudará de acordo com a média.

y=(1 1,2,3,4,5)y=(1 1,2,3,4,99)significar(y)=mediana(y)significar(y)>mediana(y). Mas recomendo começar primeiro com a explicação geométrica / visual "baseada em blob": na minha experiência, é mais fácil começar com uma demonstração gráfica de agitação manual e depois passar para exemplos de brinquedos concretos. Acho que a maioria das pessoas (inclusive eu) não é naturalmente orientada para números, e começar com uma explicação numérica é uma receita para confusão. Você sempre pode voltar e ensinar definições mais precisas posteriormente.

O modo é o ponto em que, se os pontos são amostrados aleatoriamente a partir desse blob, é mais provável que ele apareça (reconhecendo que isso é uma farsa para dados contínuos). Pode ser, mas não precisa, localizado próximo à média ou mediana.

Uma vez que você explicou estes conceitos, então você pode avançar para uma demo "estatística de aparência" mais:

demonstração

A linha sólida é a média. A linha tracejada é a mediana. A linha pontilhada é o modo. A média representa as posições dos pontos de dados ao longo do eixo x, enquanto a mediana reflete apenas o número de pontos de dados em ambos os lados. O modo é apenas o ponto de maior probabilidade, diferente da média e da mediana.

Código R:

set.seed(47730)
y <- rgamma(100, 2, 2)
d <- density(y)
plot(d)
rug(y)
abline(v = mean(y), lty = 1)
abline(v = median(y), lty = 2)
abline(v = d$x[which.max(d$y)], lty = 3)

Boas explicações, mas realmente isso pressupõe muito mais do que "habilidades aritméticas básicas": pensamento geométrico, mecânica elementar, amostragem aleatória, teoria das probabilidades (incluindo a função densidade) são todos invocados aqui. Esse é um comentário, que não pretende ser uma crítica desagradável, pois acho que a pergunta é difícil.
Nick Cox

@NickCox bons pontos, com certeza. Mas agora que estou pensando nisso, continuo usando-os, porque, por sua vez, podem ser explicados sem matemática (por exemplo, a explicação "gangorra" de ttnphns nos comentários sobre a questão principal), ou eles já estão compreendido intuitivamente em algum nível por muitas pessoas. A densidade é um pouco de um alcance, mas eu não acho que você nunca precisa ir lá
shadowtalker

(@ttnphns: marcação você no caso de você querer pesar nele não me deixa marcá-lo tanto em um comentário.)
shadowtalker

A densidade não é tão obscura. A maioria das pessoas deve lembrar a densidade da física e a densidade populacional da geografia, ou apenas conhecimentos gerais.
Nick Cox

@NickCox Eu pensei que era isso que você queria dizer com referência à mecânica elementar. Além da demonstração de densidade, também não vejo como a amostragem aleatória é necessária. De qualquer forma, imaginei que o ponto de discórdia estaria deixando um estudante não técnico à vontade com a ideia de uma nuvem de pontos. Talvez leve isso para conversar?
precisa saber é o seguinte

2

O " médio ", " mediana " e " modo " são "tendência central", também conhecido como "resultado mais provável" em diferentes domínios. São todas as "melhores apostas" em diferentes "jogos".

Probabilidade e estatística é um campo que foi, em parte, criado por jogadores ( link , link ). Quando você vai a corridas de cavalos ou a mesa de pôquer, deseja conhecer algumas ciências que o ajudam a vencer. Eles escreveram também e escreveram sobre isso, para que você não tenha que inventar você mesmo.

Em uma corrida de cavalos, você quer escolher um vencedor. Você não possui informações futuras, mas conhece algumas informações anteriores. Você sabe o quão rápido cada cavalo correu nas últimas corridas. Se você quiser fazer uma estimativa de quão rápido eles provavelmente serão executados na próxima corrida, poderá calcular e comparar a média, também conhecida como a média, dos tempos de corrida.

Outra tendência central é a "mediana" - que é o centro de uma lista classificada. E se eu colocasse um erro de digitação horrível na sua lista de tempos de corrida e o valor fosse 1000x mais longo que todos os outros. Isso estragaria sua estimativa. Você pode não apostar no cavalo vencedor. Como você lida com isso? Você poderia procurar manualmente esse valor ou usar a "mediana".

E se você estiver jogando cartas, como " blackjack ", e tentando descobrir se precisa de outra carta, dadas as cartas anteriores. O cartão que você está procurando não é 3,14 porque os números dos cartões são valores inteiros. Como você descobre qual é a sua melhor aposta quando "média" ou mediana não é significativa? Nesse caso, você quer apostar no "modo" - a carta mais provável de sair da pilha de distribuidores.

Nos três casos, a tendência central é apenas outra maneira de dizer "melhor aposta".

Se você deseja dar conta não apenas da tendência central em suas apostas, ou seja, se deseja apostar para poder reduzir os impactos de uma perda enquanto maximiza os ganhos, deve considerar as "tendências de variação". Coisas como desvio padrão, faixas interquantílicas ou modos alternativos e suas frequências são usadas para minimizar as perdas máximas e maximizar os ganhos prováveis.


0

Eu acho que é útil explicar esse conceito ao considerar vários meios, medianas e modos. Esses valores não existem sozinhos no vácuo.

Por exemplo, aqui está como eu explicaria dizer.

Digamos que você tenha 2 caixas de melancias (caixas 1 e 2). É selado para que você não possa ver as melancias dentro e, portanto, você não sabe o tamanho delas. No entanto, você conhece o peso total das melancias em cada caixa e cada uma contém o mesmo número de melancias. A partir disso, você pode calcular os pesos médios de cada caixa de melancias (M1 e M2).

Agora que você tem dois valores médios diferentes M1 e M2, é possível fazer uma comparação aproximada do conteúdo individual. Se M1> M2, as melancias selecionadas aleatoriamente na caixa 1 provavelmente podem ser mais pesadas do que as colhidas na caixa 2.

Claro, eu adoraria comentários sobre essa perspectiva.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.