Uma moeda é lançada 900 vezes e as cabeças aparecem 490 vezes. O resultado apóia a hipótese de que a moeda é imparcial?
Uma moeda é lançada 900 vezes e as cabeças aparecem 490 vezes. O resultado apóia a hipótese de que a moeda é imparcial?
Respostas:
Aqui a hipótese nula natural é que a moeda é imparcial, ou seja, que a probabilidade de uma cabeça é igual a . A hipótese alternativa mais razoável é aquele , embora se possa defender a hipótese alternativa unilateral .
Precisamos escolher o nível de significância do teste. Isso é contigo. Dois números tradicionais são% e %
Suponha que a hipótese nula seja válida. Então o número de cabeças possui distribuição binomial com médiae desvio padrão .
A probabilidade de que, ao jogar uma moeda justa, o número de caras difira de de ou mais (em qualquer direção) é, por simetria,
Assim, se a moeda não era imparcial, várias cabeças que diferem de de ou mais seria bem improvável. Teria probabilidade menor que% então no% de nível de significância, rejeitamos a hipótese nula.
Também podemos usar a aproximação normal ao binomial para estimar a probabilidade de que o número de cabeças seja ou sob a hipótese nula . Nosso normal tem média e variação é com probabilidade a probabilidade de que um normal padrão seja . Nas tabelas para o normal, trata-se de. Duplo para levar em consideração a cauda esquerda. Nos entendemos, razoavelmente próximo do valor fornecido pela Wolfram Alpha e sob \%. Então, se usarmos\% como nosso nível de significância, novamente rejeitamos a hipótese nula .
Comentários: . Na aproximação normal ao binômio, obtemos uma melhor aproximação à probabilidade de o binômio ser calculando a probabilidade de que o normal seja . Se você quiser procurar, esta é a correção de continuidade . Se usarmos a aproximação normal com correção de continuidade, descobrimos que a probabilidade de ou mais ou ou menos cabeças é sobre , bem perto da resposta "exata" fornecida pela Wolfram Alpha. Assim, podemos encontrar uma estimativa muito precisa, como nos velhos tempos, usando tabelas do padrão normal e fazendo a aritmética "à mão".
. Suponha que usemos a hipótese alternativa um pouco menos natural. E se, a probabilidade de ou mais é sobre . Assim, novamente no% de nível de significância, rejeitaríamos a hipótese nula, na verdade a rejeitaríamos mesmo se estivéssemos usando o nível de significância .
Sempre é necessário estabelecer um nível de significância, pois é possível que uma moeda justa produza, digamos ou mais cabeças joga, ridiculamente improvável.
40 or more
, mas não 40 or less
ou apenas 40
?
Se a moeda é imparcial, então a probabilidade de 'cabeças' é . Portanto, o número de cabeças lançadas em 900 tentativas,, tem um distribuição sob a hipótese nula de uma moeda justa. Então o-valor - a probabilidade de ver um resultado tão extremo ou mais extremo, dado que a moeda está longe, é
Se você procurar as duas faces -valor, isso seria
Vou deixar para você descrever por que esse é o caso.
Sabemos que a função de massa para , é
Vou deixar para você calcular -valor que você procura.
Nota: O tamanho da amostra aqui é suficientemente grande para que você possa usar a aproximação normal da distribuição binomial. Eu detalhei acima como calcular o valor exato-valor.
O exemplo da página da Wikipedia no Bayes Factor parece bastante relevante para a questão. Se tivermos dois modelos, M1, onde a moeda é exatamente imparcial (q = 0,5), e M2, onde a probabilidade de uma cabeça é desconhecida, então usamos uma distribuição anterior plana em 1. Em seguida, calculamos o fator bayes
Onde
e
Dá um fator Bayes de , que de acordo com a escala usual de interpretação "quase não vale a pena mencionar".
Observe, no entanto (i) o fator Bayes possui uma penalidade embutida no ocam que favorece modelos simples, e o M1 é muito mais simples, pois não possui parâmetros de incômodo, como o M2; (ii) um apartamento antesnão é fisicamente razoável, na prática uma moeda tendenciosa será quase justa, a menos que a moeda seja obviamente assimétrica; (iii) foi um dia longo e eu poderia facilmente ter cometido algum erro em algum lugar da análise, desde suposições a cálculos.
Observe que a moeda é tendenciosa se for um objeto físico, pois sua assimetria significa que não será exatamente tão provável que caia cara quanto coroa.
Sua pergunta pode ser tratada de várias maneiras diferentes.
O teste tradicional de hipóteses é projetado para descartar possibilidades, não necessariamente prová-las. Nesse caso, podemos usarcomo a hipótese nula e veja se os dados (490 de 900 cabeças) podem ser usados para rejeitar essa hipótese nula calculando um valor-p. Se o valor p for menor que então rejeitamos o nulo, mas um valor p não significa que podemos dizer que os dados suportam o nulo, apenas que ele é consistente com a suposição de que o nulo é verdadeiro, mas, na verdade, o nulo pode ser falso, apenas a verdade é um valor de muito perto de .
A abordagem de "equivalência" seria definir imparcialmente não como mas escolha uma pequena região em torno de 0,5 a ser considerada imparcial . Então, se o intervalo de confiança na proporção verdadeira estiver totalmente dentro do intervalo de equivalência de "imparcial", os dados apoiariam a hipótese de "imparcialidade".
Outra abordagem seria usar uma abordagem bayesiana onde começamos com uma distribuição anterior da proporção verdadeira incluindo uma massa pontual em 0,5 e o restante do spread de probabilidade entre os valores possíveis. Em seguida, combine isso com os dados para obter uma posterior. Se o probiótico posterioun de é alto o suficiente para apoiar a alegação de ser imparcial.
E uma ilustração R:
Não se incomodando em aproximar pelo normal, podemos observar uma variável aleatória binomial distribuída com n = 900 ep = 0,5 sob a hipótese nula (ou seja, se a moeda não for imparcial, então p = probabilidade de cara (ou coroa) = 0,5).
Se quisermos testar a alternativa que Ha: p <> 0,5 em alfa 0,05, podemos observar as caudas da distribuição sob o nulo da seguinte forma e ver que 490 fica fora do intervalo {421, 479} e, portanto, rejeitamos Ho .
n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479
Para esclarecer a abordagem bayesiana:
Você começa sem saber nada, exceto que P(Heads)
está dentro [0,1]
. Então comece com uma entropia máxima antes -> uniform(0,1)
. Isso pode ser representado como uma distribuição beta -> beta(1,1)
.
Cada vez que você joga a moeda, faça uma atualização bayesiana da moeda P(Heads)
multiplicando cada ponto da distribuição pela probabilidade (multiplique x
se você rolar cabeças, multiplique (1-x)
se conseguir coroa) e re-normalize a probabilidade total de 1 Isso é o que a distribuição beta faz, portanto, se o primeiro rolo for cara, você terá beta(2,1)
. No seu caso você tem beta(490,510)
.
A partir daí, eu calcularia o intervalo de probabilidade de 95% e, se 0,5 não estiver nesse intervalo, começaria a suspeitar.
Na primeira vez em que fiz esse exercício, fiquei realmente surpreso com o tempo que levou para convergir ... Comecei porque alguém disse "se você jogar uma moeda 100 vezes, você sabe P(Heads)
que +/- 1%" acaba sendo totalmente errado, você precisa de magnitudes superiores a 100 movimentos.
Hipótese nula, Ho: P = 0,5 (P = Q = 0,5)
H1: P> 0,5
onde P é o prob da ocorrência da cabeça.
sabemos z = (pP) / sqrt (PQ / N)
onde p = 490/900 = 0,54
Agora z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)
z = 2
portanto, a 5% de LOS (ou seja, 1,64 <2) Ho é rejeitado
daqui a moeda é tendenciosa .....