Suponha que você queira saber qual porcentagem de pessoas votaria em um candidato em particular (digamos, , observe que, por definição, π está entre 0 e 100). Você amostra N eleitores aleatoriamente para descobrir como eles votariam e sua pesquisa com esses N eleitores indica que a porcentagem é p . Portanto, você gostaria de estabelecer um intervalo de confiança para a porcentagem verdadeira.ππNNp
Se você assumir que é normalmente distribuído (uma suposição que pode ou não ser justificada dependendo de quão grande é N ), seu intervalo de confiança para π seria da seguinte forma:
C I = [ p - k ∗ s d ( p ) , p + k ∗ s d ( p ) ]
onde kpNπ
CI=[p−k∗sd(p), p+k∗sd(p)]
k é uma constante que depende da extensão de confiança desejada (ou seja, 95% ou 99%, etc.).
Do ponto de vista da pesquisa, você deseja que a largura do seu intervalo de confiança seja 'baixa'. Geralmente, os pesquisadores de pesquisas trabalham com a margem de erro que é basicamente metade do IC. Em outras palavras, . MoE=k∗sd(p)
Aqui é como nós iria sobre cálculo : Por definição, p = Σ X i / N onde, X i = 1 se eleitor i vota no candidato e 0 caso contrário.sd(p)p=∑Xi/NXi=1i0
Xi
Var(P)=V(∑XiN)=∑V(Xi)N2=Nπ(1−π)N2=π(1−π)N.
sd(p)=π∗(1−π)N−−−−−−−−−√
πsd(p)π=0.5sd(p)=0.5∗0.5/N−−−−−−−−−√=0.5/N−−√
NN não precisa ser muito grande para obter um intervalo de confiança estreito .
k=1.96N=1000
[p−1.960.51000−−−−√, p+1.960.51000−−−−√]=[p−0.03, p+0.03]
NNπ=50%