Como NÃO usar estatísticas


15

Essa é uma pergunta em aberto, mas quero deixar claro. Dada uma população suficiente, você poderá aprender alguma coisa (esta é a parte aberta), mas o que você aprender sobre sua população, quando isso será aplicável a um membro da população?

Pelo que entendi das estatísticas, nunca é aplicável a um único membro de uma população; no entanto, muitas vezes me encontro em uma discussão em que a outra pessoa diz "eu li que 10% da população mundial tem essa doença" e continuo a Conclua que cada décima pessoa na sala tem essa doença.

Entendo que dez pessoas nesta sala não são uma amostra grande o suficiente para a estatística ser relevante, mas aparentemente muitas não.

Depois, há essa coisa sobre amostras grandes o suficiente . Você só precisa investigar uma população grande o suficiente para obter estatísticas confiáveis. Isso, porém, não é proporcional à complexidade da estatística? Se estou medindo algo muito raro, isso não significa que preciso de uma amostra muito maior para poder determinar a relevância dessa estatística?

O fato é que eu realmente questiono a validade de qualquer jornal ou artigo quando há estatísticas envolvidas, da maneira como são usadas para criar confiança.

Isso é um pouco de fundo.

De volta à pergunta, de que maneira você NÃO pode ou NÃO pode usar estatísticas para formar um argumento . Neguei a pergunta porque gostaria de descobrir mais sobre equívocos comuns sobre estatísticas.


2
Esta é apenas uma resposta muito parcial, por isso não vou publicá-la como resposta. Você ESTÁ correto que estatísticas complexas precisam de populações maiores; você está se referindo ao conceito de "graus de liberdade", que é simplesmente o número de variáveis ​​independentes menos uma. Além disso, ao fazer algo como um teste-p, seu limite de rejeição depende do número de graus de liberdade, além do valor-p que você escolheu (normalmente 0,05).

2
Se mais pessoas lerem o livro Como contar aos mentirosos, de Hooke, dos estatísticos , talvez não existam tantos "otários estatísticos" quanto o que temos agora no mundo.
JM não é estatístico

1
Acho que você pode se beneficiar de fazer esta pergunta no stats stackexchange - sinalizei a pergunta para que talvez ela seja movida para lá.
InterestedGuest

Eu nem sabia que tínhamos um fórum dedicado à análise estatística. Eu mover a pergunta: Se eu soubesse como ...

Respostas:


2

Para tirar conclusões sobre um grupo com base na população, o grupo deve ser representativo da população e independente. Outros já discutiram isso, então não vou me debruçar sobre essa peça.

Outra coisa a considerar é a não-intuitividade das probabilidades. Vamos supor que tenhamos um grupo de 10 pessoas independentes e representativas da população (amostra aleatória) e que sabemos que na população 10% têm uma característica específica. Portanto, cada uma das 10 pessoas tem 10% de chance de ter a característica. A suposição comum é que é bastante certo que pelo menos 1 terá a característica. Mas esse é um problema binomial simples, podemos calcular a probabilidade de que nenhum dos 10 tenha a característica, é de cerca de 35% (converge para 1 / e para um grupo maior / menor probabilidade) o que é muito maior do que a maioria das pessoas imaginaria. Há também uma chance de 26% de que 2 ou mais pessoas tenham essa característica.


9

A menos que as pessoas na sala sejam uma amostra aleatória da população mundial, quaisquer conclusões baseadas em estatísticas sobre a população mundial serão muito suspeitas. Uma em cada cinco pessoas no mundo é chinesa, mas nenhum dos meus cinco filhos é ...


6
  1. Para abordar a aplicação excessiva de estatísticas em pequenas amostras, recomendo combater piadas conhecidas ("Estou tão empolgada que minha mãe está grávida de novo e meu irmão bebê é chinês." "Por quê?". é chinês ").

  2. Na verdade, eu recomendo piadas para abordar todos os tipos de equívocos nas estatísticas, consulte http://xkcd.com/552/ para correlação e causalidade.

  3. O problema dos artigos de jornal raramente é o fato de tratar um fenômeno raro.

  4. O paradoxo de Simpsons vem à mente como exemplo de que as estatísticas raramente podem ser usadas sem análise das causas.


2
A variação da piada "O bebê chinês" Eu ouvi tinha a gestante ter medo de que seu bebê pode ser considerado como um estrangeiro ilegal e, portanto, deportados ...
JM não é um estatístico

3

Existe um artigo interessante de Mary Gray sobre o uso indevido de estatísticas em processos judiciais e coisas assim ...

Gray, Mary W .; Estatística e Direito. Matemática. Mag. 56 (1983), n. 2, 67-81



1

Análise estatística ou dados estatísticos?

Penso que este exemplo na sua pergunta se refere a dados estatísticos: "Eu li que 10% da população mundial tem essa doença". Em outras palavras, neste exemplo, alguém usa números para ajudar a comunicar a quantidade de maneira mais eficaz do que apenas dizer 'muitas pessoas'.

Meu palpite é que a resposta para sua pergunta está oculta na motivação do orador sobre o motivo pelo qual ela está usando números. Poderia ser para comunicar alguma noção melhor ou mostrar autoridade ou deslumbrar o ouvinte. A coisa boa sobre declarar números em vez de dizer "muito grande" é que as pessoas podem refutar o número. Veja a idéia de Popper sobre refutação.


0

Hipótese: UMA

(Livro didático) Resultado: não rejeiteUMA (σ=c)

Sua declaração: UMA mantém com probabilidade σ!

Correto seria: Nesse caso, você não sabe nada. Se você quer "provar"UMA, sua hipótese deve ser ¬UMA; rejeite-o comσ to get the desired statement.


0

From what I understand of statistics it's never applicable to a single member of a population

It's not true. It depends on the application.

Example: nuclear decay in physics. The rate of decay, defines the probability of a decay of every single nucleus. You take any nucleus and it'll have exactly the same probability of decay, which you established by experimentation on the sample.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.