Estou tentando resolver a seguinte pergunta:
O jogador A venceu 17 dos 25 jogos, enquanto o jogador B venceu 8 dos 20 - há uma diferença significativa entre as duas proporções?
O que se faz em R que vem à mente é o seguinte:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Portanto, este teste diz que a diferença não é significativa no nível de confiança de 95%.
Como sabemos que prop.test()
está apenas usando uma aproximação, quero tornar as coisas mais exatas usando um teste binomial exato - e faço isso de maneira inversa:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
Agora isso é estranho, não é? Os valores p são totalmente diferentes a cada vez! Em ambos os casos, agora os resultados são (altamente) significativos, mas os valores de p parecem pular a esmo.
Minhas perguntas
- Por que são os valores de p que diferente de cada vez?
- Como executar um teste binomial exato de duas proporções de amostra em R corretamente?
prop.test
vschisq.test
), o mesmo conceito subjacente está nesta questão . Você está executando três testes diferentes com diferentes "hipóteses nulas" em cada um dos seus três exemplos.