Considere a situação em que você tem n=20observações de um processo binário (2 resultados). Freqüentemente, os dois resultados possíveis em cada teste são chamados de Sucesso e Fracasso.
Intervalo de confiança freqüentista. Suponha que você observex=15 sucessos no n=20ensaios. Ver o númeroX de sucessos como variável aleatória X∼Binom(n=20;p), onde a probabilidade de sucesso pé uma constante desconhecida. O intervalo de confiança frequentista de 95% da Wald é baseado emp^=15/20=0.75, uma estimativa de p.
Usando uma aproximação normal, esse IC tem a forma p^±1.96p^(1−p^)/n−−−−−−−−−√ ou
(0.560,0.940).[O
estilo Agresti-Coull um pouco aprimorado de 95% CI é( 0,526 , 0,890 ) . ]
Uma interpretação comum é que o procedimento que produz esse intervalo produzirá limites de confiança inferiores e superiores que incluem o valor verdadeiro de pem 95% dos casos a longo prazo. [A vantagem do intervalo Agresti-Coull é que a proporção de longo prazo dessas inclusões é mais próxima de 95% do que no intervalo Wald.]
Intervalo credível bayesiano.A abordagem bayesiana começa tratandopcomo uma variável aleatória. Antes de ver os dados, se não tivermos experiência prévia com o tipo de experimento binomial sendo conduzido ou nenhuma opinião pessoal sobre a distribuição dep , podemos escolher a distribuição uniforme 'plana' ou 'não informativa', dizendo p ∼ U n i f( 0 , 1 ) ≡ B e t a ( 1 , 1 ) .
Então, dados 15 sucessos em 20 ensaios binomiais, encontramos a distribuição posterior de p como o produto da distribuição anterior e da função de probabilidade binomial.
f( p | x ) ∝p1 - 1( 1 - p)1 - 1×p15( 1 - p)5∝p16 - 1( 1 - p)6 - 1,
onde o símbolo ∝ (leia-se 'proporcional a') indica que estamos omitindo fatores constantes 'normativos' das distribuições, que não contêm p .
Sem o fator normativo, uma função de densidade ou PMF é chamada de 'núcleo' da distribuição.
Aqui reconhecemos que o núcleo da distribuição posterior é o da distribuição B e t a (16,6).Então, um intervalo posterior bayesiano de 95% ou intervalo credível é encontrado cortando 2,5% de cada cauda da distribuição posterior. Aqui está o resultado de R:
( 0,528 , 0,887 ) .[Para obter informações sobre distribuições beta, consulte Wikipedia .]
qbeta(c(.025,.975), 16, 6)
[1] 0.5283402 0.8871906
Se acreditamos que o anterior era razoável e acreditamos que o experimento binomial de 20 tentativas foi razoavelmente conduzido, então logicamente devemos esperar que a estimativa do intervalo bayesiano forneça informações úteis sobre o experimento em questão - sem referência a uma hipótese hipotética correr futuro.
Observe que esse intervalo credível bayesiano é numericamente semelhante ao intervalo de confiança Agresti-Coull. No entanto, como você ressalta, as interpretações dos dois tipos de estimativas de intervalo (freqüentista e bayesiana) não são as mesmas.
Informativo prévio. Antes de vermos os dados, se tivéssemos motivos para acreditar quep ≈ 2 / 3 , então poderíamos ter escolhido a distribuição B e t a (8,4)como a distribuição anterior. [Esta distribuição tem média de 2/3, desvio padrão de 0,35 e coloca cerca de 95% de sua probabilidade no intervalo( 0,39 , 0,89 ) .]
qbeta(c(.025,.975), 8,4)
[1] 0.3902574 0.8907366
Nesse caso, multiplicar o anterior pela probabilidade dá ao núcleo posterior de B o e t um (23,7),
para que o intervalo credível bayesiano de 95% seja
( 0,603 , 0,897 ) . A distribuição posterior é uma fusão das informações no prior e na probabilidade, que estão em concordância grosseira, de modo que a estimativa do intervalo bayesiano resultante é menor que o intervalo do plano anterior.
qbeta(c(.025,.975), 23,7)
[1] 0.6027531 0.8970164
Notas: (1) A função beta prévia e a probabilidade binomial são 'conjugadas', ou seja, matematicamente compatíveis de uma maneira que nos permite encontrar a distribuição posterior sem cálculo. Às vezes, não parece haver uma distribuição anterior que seja conjugada com a probabilidade. Então, pode ser necessário usar a integração numérica para encontrar a distribuição posterior.
(2) Um intervalo credível bayesiano de um prior não informativo depende essencialmente da função de verossimilhança. Além disso, grande parte da inferência freqüentista depende da função de probabilidade. Assim, não é surpresa que um intervalo credível bayesiano de um plano anterior possa ser numericamente semelhante a um intervalo de confiança freqüentista com base na mesma probabilidade.