Não use a aproximação normal
Muito foi escrito sobre esse problema. Um conselho geral é nunca usar a aproximação normal (ou seja, o intervalo de confiança assintótico / Wald), pois possui propriedades de cobertura terríveis. Código R para ilustrar isso:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Para pequenas probabilidades de sucesso, você pode solicitar um intervalo de confiança de 95%, mas obter, por exemplo, um intervalo de confiança de 10%!
Recomendações
Então, o que devemos usar? Acredito que as recomendações atuais são as listadas no artigo Estimativa de intervalo para uma proporção binomial de Brown, Cai e DasGupta na Statistical Science 2001, vol. 16, n. 2, páginas 101–133. Os autores examinaram vários métodos para calcular intervalos de confiança e chegaram à seguinte conclusão.
[Recomendamos o intervalo Wilson ou o intervalo anterior de Jeffreys de cauda igual para n pequeno e o intervalo sugerido em Agresti e Coull para n maior .
O intervalo Wilson também é chamado de intervalo de pontuação , pois é baseado na inversão de um teste de pontuação.
Cálculo dos intervalos
Para calcular esses intervalos de confiança, você pode usar esta calculadora on-line ou a binom.confint()
função no binom
pacote em R. Por exemplo, para 0 sucessos em 25 tentativas, o código R seria:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Aqui bayes
está o intervalo de Jeffreys. (O argumento type="central"
é necessário para obter o intervalo igual ).
Observe que você deve decidir qual dos três métodos deseja usar antes de calcular o intervalo. Olhar para todos os três e selecionar o menor, naturalmente oferecerá uma probabilidade de cobertura muito pequena.
Uma resposta rápida e aproximada
Como nota final, se você observar exatamente zero sucessos em seu n ensaios e apenas desejar um intervalo de confiança aproximado muito rápido, poderá usar a regra de três . Simplesmente divida o número 3 por n . No exemplo acima, n é 25, então o limite superior é 3/25 = 0,12 (o limite inferior é, obviamente, 0).