Como avaliar se uma moeda lançada 900 vezes e aparece cara 490 vezes é tendenciosa?


9

Uma moeda é lançada 900 vezes e as cabeças aparecem 490 vezes. O resultado apóia a hipótese de que a moeda é imparcial?


3
Hipótese nula: a moeda é imparcial. Alternativa, difícil de saber, possivelmente a probabilidade simétrica de uma cabeça é1/2. Nível de significância: você decide. Se a hipótese nula se mantiver, o número de cabeças terá distribuição quase normal, desvio padrão(900)(1/2)(1/2)=15. Agora490 é sobre 2.66 unidades de desvio padrão da média (450) se a hipótese nula se mantiver. Em tabelas de padrão normal ou não, isso tem probabilidade de0.0078. Então no1% nível de significância, rejeitamos a hipótese nula.

1
Você pode querer dar uma olhada no Teste de Hipóteses

7
Para referência futura: Não é recomendável desencorajar o cruzamento de cópias completas da sua pergunta para vários sites do SE . Isso acontece normalmente com novos usuários que não estão familiarizados com esta política, portanto, não se sinta mal. Apenas, por favor, mantenha isso em mente. Bem vindo ao site.
cardeal

Esta pergunta, que pode ser exatamente o que o problema da lição de casa de OP Sanu indica ou pode ser a paráfrase da pergunta realmente feita por Sanu, diz: "O resultado apóia a hipótese de que a moeda é imparcial?" Todas as respostas consideram a hipótese nulaP(Heads)=0.5. Minha pergunta é: as observações sustentam a hipótese nula? Mesmo que a moeda caísse cara450 vezes fora de 900, isso não é suporte para a hipótese nula; apenas evidências muito fracas apoiando a rejeição do nulo. A evidência é sempre a favor da rejeição do nulo, nunca em apoio ao nulo.
usar o seguinte código

@ Dilip: Se você reler a resposta de Greg, verá que seu comentário acima não é verdadeiro. Um teste de equivalência (ou, freqüentemente, bioequivalência) tem uma alternativa que é uma versão ligeiramente "confusa" da hipótese desejada para a qual se deseja evidência. Acho que você verá imediatamente por que precisamos dar um pouco de espaço de manobra extra do que realmente gostaríamos.
cardeal

Respostas:


16

Aqui a hipótese nula natural H0 é que a moeda é imparcial, ou seja, que a probabilidade p de uma cabeça é igual a 1/2. A hipótese alternativa mais razoávelH1 é aquele p1/2, embora se possa defender a hipótese alternativa unilateral p>1/2.

Precisamos escolher o nível de significância do teste. Isso é contigo. Dois números tradicionais são5% e 1%

Suponha que a hipótese nula seja válida. Então o número de cabeças possui distribuição binomial com média(900)(1/2)=450e desvio padrão (900)(1/2)(1/2)=15.

A probabilidade de que, ao jogar uma moeda justa, o número de caras difira de 450 de 40 ou mais (em qualquer direção) é, por simetria,

2k=490900(900k)(12)900.
Não é prático calcular manualmente, mas o Wolfram Alpha fornece uma resposta de aproximadamente 0.008419.

Assim, se a moeda não era imparcial, várias cabeças que diferem de450 de 40ou mais seria bem improvável. Teria probabilidade menor que1% então no1% de nível de significância, rejeitamos a hipótese nula.

Também podemos usar a aproximação normal ao binomial para estimar a probabilidade de que o número de cabeças seja490 ou 410 sob a hipótese nula p=1/2. Nosso normal tem média450 e variação 15 é 490 com probabilidade a probabilidade de que um normal padrão seja 40/15. Nas tabelas para o normal, trata-se de0.0039. Duplo para levar em consideração a cauda esquerda. Nos entendemos0.0078, razoavelmente próximo do valor fornecido pela Wolfram Alpha e sob 1\%. Então, se usarmos1\% como nosso nível de significância, novamente rejeitamos a hipótese nula H0.

Comentários: 1. Na aproximação normal ao binômio, obtemos uma melhor aproximação à probabilidade de o binômio ser490 calculando a probabilidade de que o normal seja 489.5. Se você quiser procurar, esta é a correção de continuidade . Se usarmos a aproximação normal com correção de continuidade, descobrimos que a probabilidade de490 ou mais ou 410 ou menos cabeças é sobre 0.008468, bem perto da resposta "exata" fornecida pela Wolfram Alpha. Assim, podemos encontrar uma estimativa muito precisa, como nos velhos tempos, usando tabelas do padrão normal e fazendo a aritmética "à mão".

2. Suponha que usemos a hipótese alternativa um pouco menos naturalp>1/2. E sep=1/2, a probabilidade de 490 ou mais é sobre 0.00421. Assim, novamente no1% de nível de significância, rejeitaríamos a hipótese nula, na verdade a rejeitaríamos mesmo se estivéssemos usando o nível de significância 0.005.

Sempre é necessário estabelecer um nível de significância, pois é possível que uma moeda justa produza, digamos550 ou mais cabeças 900 joga, ridiculamente improvável.


2
Esta pergunta foi marcada como lição de casa. Nesses casos, é desencorajado a dar uma resposta completa e independente que não deixa trabalho para a pessoa que pergunta.
Macro

1
Esta foi uma resposta do math.SE que foi mesclada com a pergunta e é de autoria de um usuário com um representante muito alto no math.SE. A pergunta não foi marcada como dever de casa naquele momento.
cardeal

Não entendo bem a lógica de "Assim, se a moeda não fosse imparcial, seria improvável um número de cabeças que diferem de 450 por 40 ou mais". Por que precisaríamos calcular a probabilidade de 40 or more, mas não 40 or lessou apenas 40?
uma oferta não pode recusar

e, portanto, a resposta de @ Marco tem menos curtidas e muito mais comentários decorrentes das confusões: p
Evan Pu

8

Se a moeda é imparcial, então a probabilidade de 'cabeças' é 12. Portanto, o número de cabeças lançadas em 900 tentativas,X, tem um Binomial(900,12)distribuição sob a hipótese nula de uma moeda justa. Então op-valor - a probabilidade de ver um resultado tão extremo ou mais extremo, dado que a moeda está longe, é

P(X490)

Se você procurar as duas faces p-valor, isso seria

1P(410<X<490)

Vou deixar para você descrever por que esse é o caso.

Sabemos que a função de massa para YBinomial(n,p), é

P(Y=y)=(ny)py(1p)ny

Vou deixar para você calcular p-valor que você procura.

Nota: O tamanho da amostra aqui é suficientemente grande para que você possa usar a aproximação normal da distribuição binomial. Eu detalhei acima como calcular o valor exatop-valor.


O p-valor ser calculado para um teste de dois lados ou um teste de um lado?
usar o seguinte código

1
Imagino frente e verso, uma vez que a pergunta só procurava determinar se a moeda era ou não imparcial. Ou seja, parece queHa:p1/2. Mas não está claro se o que está escrito acima é a pergunta literal ou uma paráfrase.
Macro

1
Portanto, neste caso, e possivelmente muitos outros, a simetria implica que os dois lados p-value é exatamente o dobro do lado unilateral p-valor. O unilateralp-value é menor que 0.005 enquanto os dois lados p-valor é maior. Portanto, o nulo deve ser rejeitado no0.5% nível (eu sei, não o mais usado 5% e 1%níveis) se estivermos usando um teste unilateral e não for rejeitado se estivermos usando um teste frente e verso. Isso está correto?
precisa saber é o seguinte

1
Sim, se você estivesse fazendo o teste com nível α=.005, você rejeitaria o teste unilateral e não o teste bilateral. Se alguém deve ou não fazer um teste unilateral ou bilateral, deve ser escolhido a priori, com base na pergunta da pesquisa; portanto, esse problema não deve surgir na prática.
Macro

"Se alguém deve ou não escolher um teste de um ou dois lados a priori" é válido, mas e se a escolha não tiver sido feita? No caso de OP Sanu ser informado que os dados experimentais apóiam a hipótese de que a moeda é imparcial no0.5% (nulo não é rejeitado pelo teste frente e verso), mas também suporta a hipótese de que P(Heads)>12 no 0.5%nível (nulo é rejeitado pelo teste unilateral)?
usar o seguinte código

4

O exemplo da página da Wikipedia no Bayes Factor parece bastante relevante para a questão. Se tivermos dois modelos, M1, onde a moeda é exatamente imparcial (q = 0,5), e M2, onde a probabilidade de uma cabeça é desconhecida, então usamos uma distribuição anterior plana em 1. Em seguida, calculamos o fator bayes

K=p(x=490|M0)p(x=490|M1)

Onde

p(x=490|M1)=nchoosek(900,490)12900=7.5896×104

e

p(x=490|M2)=01nchoosek(900,490)q490(1q)410dq=1901

Dá um fator Bayes de K1.4624, que de acordo com a escala usual de interpretação "quase não vale a pena mencionar".

Observe, no entanto (i) o fator Bayes possui uma penalidade embutida no ocam que favorece modelos simples, e o M1 é muito mais simples, pois não possui parâmetros de incômodo, como o M2; (ii) um apartamento antesqnão é fisicamente razoável, na prática uma moeda tendenciosa será quase justa, a menos que a moeda seja obviamente assimétrica; (iii) foi um dia longo e eu poderia facilmente ter cometido algum erro em algum lugar da análise, desde suposições a cálculos.

Observe que a moeda é tendenciosa se for um objeto físico, pois sua assimetria significa que não será exatamente tão provável que caia cara quanto coroa.


3

Sua pergunta pode ser tratada de várias maneiras diferentes.

O teste tradicional de hipóteses é projetado para descartar possibilidades, não necessariamente prová-las. Nesse caso, podemos usarH0:p=0.5como a hipótese nula e veja se os dados (490 de 900 cabeças) podem ser usados ​​para rejeitar essa hipótese nula calculando um valor-p. Se o valor p for menor queα então rejeitamos o nulo, mas um valor p >α não significa que podemos dizer que os dados suportam o nulo, apenas que ele é consistente com a suposição de que o nulo é verdadeiro, mas, na verdade, o nulo pode ser falso, apenas a verdade é um valor de p muito perto de 0.5.

A abordagem de "equivalência" seria definir imparcialmente não como p=0.5 mas escolha uma pequena região em torno de 0,5 a ser considerada imparcial 0.5ϵ<p<0.5+ϵ. Então, se o intervalo de confiança na proporção verdadeira estiver totalmente dentro do intervalo de equivalência de "imparcial", os dados apoiariam a hipótese de "imparcialidade".

Outra abordagem seria usar uma abordagem bayesiana onde começamos com uma distribuição anterior da proporção verdadeira pincluindo uma massa pontual em 0,5 e o restante do spread de probabilidade entre os valores possíveis. Em seguida, combine isso com os dados para obter uma posterior. Se o probiótico posterioun dep=0.5 é alto o suficiente para apoiar a alegação de ser imparcial.


Observe que muitas vezes a abordagem bayesiana resultará em posteriores contínuos e, portanto, a probabilidade posterior de p=0.5 exatamente é frequentemente 0. A questão mais interessante é, então, qual é a diferença entre a nossa estimativa posterior e 0,5.
Michael McGowan

2
@MichaelMcGowan: se alguém começar com uma massa de pontos anterior em p=0.5haverá também uma massa pontual posterior. A questão de saber se esse prior faz ou não depende do problema ...
Xian

2

E uma ilustração R:

Não se incomodando em aproximar pelo normal, podemos observar uma variável aleatória binomial distribuída com n = 900 ep = 0,5 sob a hipótese nula (ou seja, se a moeda não for imparcial, então p = probabilidade de cara (ou coroa) = 0,5).

Se quisermos testar a alternativa que Ha: p <> 0,5 em alfa 0,05, podemos observar as caudas da distribuição sob o nulo da seguinte forma e ver que 490 fica fora do intervalo {421, 479} e, portanto, rejeitamos Ho .

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479

1

Para esclarecer a abordagem bayesiana:

Você começa sem saber nada, exceto que P(Heads)está dentro [0,1]. Então comece com uma entropia máxima antes -> uniform(0,1). Isso pode ser representado como uma distribuição beta -> beta(1,1).

Cada vez que você joga a moeda, faça uma atualização bayesiana da moeda P(Heads)multiplicando cada ponto da distribuição pela probabilidade (multiplique xse você rolar cabeças, multiplique (1-x)se conseguir coroa) e re-normalize a probabilidade total de 1 Isso é o que a distribuição beta faz, portanto, se o primeiro rolo for cara, você terá beta(2,1). No seu caso você tem beta(490,510).

A partir daí, eu calcularia o intervalo de probabilidade de 95% e, se 0,5 não estiver nesse intervalo, começaria a suspeitar.

Na primeira vez em que fiz esse exercício, fiquei realmente surpreso com o tempo que levou para convergir ... Comecei porque alguém disse "se você jogar uma moeda 100 vezes, você sabe P(Heads)que +/- 1%" acaba sendo totalmente errado, você precisa de magnitudes superiores a 100 movimentos.


0

Hipótese nula, Ho: P = 0,5 (P = Q = 0,5)

H1: P> 0,5

onde P é o prob da ocorrência da cabeça.

sabemos z = (pP) / sqrt (PQ / N)

onde p = 490/900 = 0,54

Agora z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)

z = 2

portanto, a 5% de LOS (ou seja, 1,64 <2) Ho é rejeitado

daqui a moeda é tendenciosa .....


1
Bem vindo ao nosso site! Você leu as outras respostas antes de responder? Você pode apreciar as análises ponderadas contidas em várias delas. Eles incluem os mesmos cálculos, por isso estou me perguntando que parte da sua resposta ou sua forma de apresentação representa algo mais novo ou melhor do que o que já foi publicado.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.