O teste de Barnard é usado quando o parâmetro incômodo é desconhecido sob a hipótese nula.
No entanto, no teste de degustação de mulheres, você pode argumentar que o parâmetro incômodo pode ser definido em 0,5 sob a hipótese nula (a mulher desinformada tem 50% de probabilidade de adivinhar corretamente um copo).
Então, o número de suposições corretas, sob a hipótese nula, torna-se uma distribuição binomial: adivinhando 8 xícaras com 50% de probabilidade para cada xícara.
Em outras ocasiões, você pode não ter essa probabilidade trivial de 50% para a hipótese nula. E sem margens fixas, você pode não saber qual deve ser essa probabilidade. Nesse caso, você precisa do teste de Barnard.
Mesmo se você fizesse o teste de Barnard no teste de degustação de mulheres, ele se tornaria 50% de qualquer maneira (se o resultado for de suposições corretas), já que o parâmetro incômodo com o maior valor de p é 0,5 e resultaria no teste binomial trivial ( na verdade, é a combinação de dois testes binomiais, um para os quatro primeiros copos de leite e um para os quatro primeiros copos de leite).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Abaixo está como isso resultaria em um resultado mais complicado (se nem todas as estimativas estiverem corretas, por exemplo, 2 versus 4), a contagem do que é e do que não é extremo se torna um pouco mais difícil.
(Observe também que o teste de Barnard usa, no caso de um resultado de 4-2, um parâmetro incômodo p = 0,686 que você poderia argumentar que não está correto, o valor de p para 50% de probabilidade de responder 'primeiro ao chá' seria 0,08203125. Isso se torna ainda menor quando você considera uma região diferente, em vez da região baseada na estatística de Wald, embora definir a região não seja tão fácil )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)