Keith Winstein,
EDIT: Apenas para esclarecer, esta resposta descreve o exemplo dado em Keith Winstein Answer on the King com o cruel jogo estatístico. As respostas bayesiana e frequentista usam a mesma informação, que é ignorar a informação sobre o número de moedas justas e injustas ao construir os intervalos. Se essas informações não forem ignoradas, o freqüentador deve usar a Probabilidade Beta-Binomial integrada como distribuição de amostragem na construção do intervalo de Confiança; nesse caso, o Intervalo de Confiança Clopper-Pearson não é apropriado e precisa ser modificado. Um ajuste semelhante deve ocorrer na solução bayesiana.
EDIT: Eu também esclareço o uso inicial do Clopper Pearson Interval.
EDIT: infelizmente, meu alfa é o caminho errado, e meu intervalo clopper pearson está incorreto. Minhas desculpas mais humildes a @whuber, que apontou isso corretamente, mas com quem eu inicialmente discordei e ignorei.
O IC Usando o método Clopper Pearson é muito bom
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
Assim, quem usa o intervalo de confiança Clopper Pearson nunca será decapitado. Ao observar o intervalo, é basicamente todo o espaço do parâmetro. Mas o intervalo de CP está fazendo isso, oferecendo 100% de cobertura a um intervalo supostamente de 95%! Basicamente, os Frequentistas "trapaceiam", dando um intervalo de confiança de 95% a mais do que lhe foi solicitado (embora quem não trapaceie em tal situação? Se fosse eu, eu daria o todo [0, 1] intervalo). Se o rei pedisse um IC exato de 95%, esse método freqüentador falharia independentemente do que realmente aconteceu (talvez exista um melhor?).
E o intervalo bayesiano? (especificamente o intervalo bayesiano de Desnidade Posterior Mais Alta (HPD))
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
Para citar um intervalo de confiança genuíno de 95%, então, por definição , deve haver alguns casos (isto é, pelo menos um) do intervalo observado que não contêm o valor verdadeiro do parâmetro . Caso contrário, como justificar a marca de 95%? Não seria apenas válido ou inválido chamá-lo de intervalo de 90%, 50%, 20% ou mesmo 0%?
Não vejo como simplesmente afirmar "realmente significa 95% ou mais" sem uma restrição complementar é satisfatório. Isso ocorre porque a solução matemática óbvia é todo o espaço de parâmetros e o problema é trivial. suponha que eu queira um IC de 50%? se limitar apenas os falsos negativos, todo o espaço do parâmetro será um IC válido usando apenas esse critério.
100%X=0100×1012+9101012+1%>95%X=1
Para finalizar, parece um pouco estranho solicitar um intervalo de incerteza e depois avaliar esse intervalo usando o valor verdadeiro sobre o qual não tínhamos certeza. Uma comparação "mais justa", para intervalos de confiança e credibilidade, para mim parece a verdade da declaração de incerteza dada com o intervalo .