Intervalo de confiança para amostragem de Bernoulli

Eu tenho uma amostra aleatória de variáveis aleatórias Bernoulli , em que são iidrv e , e é um parâmetro desconhecido. $X_1 ... X_N$ $X_i$ $P(X_i = 1) = p$ $p$

Obviamente, pode-se encontrar uma estimativa para : . $p$ $\hat{p}:=(X_1+\dots+X_N)/N$

Minha pergunta é como posso criar um intervalo de confiança para ? $p$

confidence-interval binomial bernoulli-distribution

— ameba diz Restabelecer Monica
fonte

A wikipedia possui detalhes sobre como calcular intervalos de confiança para amostragem de bernoulli .

Respostas:

Se a , não é perto de ou , e o tamanho da amostra é suficientemente grande (isto é, e , o intervalo de confiança pode ser estimada por uma distribuição normal e o intervalo de confiança construído assim: $\hat{p}$ $1$ $0$ $n$ $n\hat{p}>5$ $n(1-\hat{p})>5$

$\hat{p} \pm z_{1 - α / 2} \sqrt{\frac{\hat{p} (1 - \hat{p})}{n}}$ $\hat{p}\pm z_{1-\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
$\hat{p} = 0$ $n>30$ $95\%$ $[0,\frac{3}{n}]$ $\hat{p}=1$ $n+1$ $n+b$
$n$ $\hat{p}$

R fornece funções binconf {Hmisc}e binom.confint {binom}que podem ser usadas da seguinte maneira:

set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')

Agresti, Alan; Coull, Brent A. (1998). "Aproximado é melhor que 'exato' para estimativa de intervalo de proporções binomiais". The American Statistician 52: 119–126.

Jovanovic, BD e PS Levy, 1997. Um olhar sobre a regra dos três. O estatístico americano vol. 51, n. 2, pp. 137-139

Ross, TD (2003). "Intervalos de confiança precisos para proporção binomial e estimativa da taxa de Poisson". Computers in Biology and Medicine 33: 509-531.

— David LeBauer
fonte

(+1) Boa resposta. Isso se tornará uma referência para perguntas semelhantes no futuro, eu acho. No entanto, a postagem cruzada é incomum; de fato, acredito que é desaprovado, porque estraga muitos aspectos do sistema de feedback / referência / encadeamento / comentário. Considere remover uma das cópias e substituí-la por um link em um comentário.

— whuber

@whuber obrigado pelo feedback. Eu removi a outra cópia.

— David LeBauer

Na primeira fórmula, o que são z1 e alfa?

— Cirdec

z_{1 - α / 2}

$z_{1-\alpha/2}$

1 - α / 2

${1-\alpha/2}$

α

$\alpha$

3 / n

$3/n$

Intervalos de confiança com probabilidade máxima

$p$

$\hat{\beta}_0 = \log(\hat{p}/(1-\hat{p}))$

$\alpha$ $\beta_0$

CI (β_{0})_{α} = {\hat{β}}_{0} \pm Z_{α / 2} \sqrt{1 / (n \hat{p} (1 - \hat{p})}

$\text{CI}(\beta_0)_\alpha = \hat{\beta}_0 \pm \mathcal{Z}_{\alpha/2} \sqrt{1/(n\hat{p}(1-\hat{p})}$

$p$

CI (p)_{α} = 1 / (1 + \exp (- CI (β_{0})_{α})

$\text{CI}(p)_\alpha = 1/(1+\exp(-\text{CI}(\beta_0)_\alpha)$

Esse IC possui o benefício adicional de que as proporções estão no intervalo entre 0 ou 1, e o IC é sempre mais estreito que o intervalo normal enquanto estiver no nível correto. Você pode obter isso muito facilmente no R especificando:

set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))

    2.5 %    97.5 % 
0.2795322 0.4670450

Intervalos de confiança binomial exatos

$Y = n\hat{p}$ $(n,p)$ $\hat{p}$

{CI}_{α} = (F_{\hat{p}}^{- 1} (0.025), F_{\hat{p}}^{- 1} (0.975))

$\text{CI}_\alpha = (F^{-1}_{\hat{p}}(0.025), F^{-1}_{\hat{p}}(0.975))$

$p$

qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47

Intervalos de confiança medianos e imparciais

$p$ $p_{1-\alpha/2}$

p_{1 - α / 2} : P (Y = 0) / 2 + P (Y > y) > 0.975

$p_{1-\alpha/2} : P(Y = 0)/2 + P(Y > y) > 0.975$

Essa também é uma rotina computacional.

set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
  0.5*dbinom(0, 100, p) + 
    pbinom(1, 100, p, lower.tail = F) - 
    0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)

[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability

Os dois últimos métodos são implementados no epitoolspacote em R.

— AdamO
fonte