Considere um experimento que produz uma taxa entre 0 e 1. Como essa taxa é obtida não deve ser relevante nesse contexto. Foi elaborado em uma versão anterior desta pergunta , mas removida para maior clareza após uma discussão sobre a meta .
Esse experimento é repetido vezes, enquanto é pequeno (cerca de 3-10). O são assumidos como sendo independente e identicamente distribuído. A partir disso, estimamos a média calculando a média , mas como calcular um intervalo de confiança correspondente ?
Ao usar a abordagem padrão para calcular intervalos de confiança, às vezes é maior que 1. No entanto, minha intuição é que o intervalo de confiança correto ...
- ... deve estar dentro do intervalo 0 e 1
- ... deve ficar menor com o aumento
- ... é da ordem do calculado usando a abordagem padrão
- ... é calculado por um método matematicamente correto
Esses não são requisitos absolutos, mas eu gostaria de entender pelo menos por que minha intuição está errada.
Cálculos com base em respostas existentes
A seguir, os intervalos de confiança resultantes das respostas existentes são comparados para .
Abordagem padrão (também conhecida como "Matemática escolar")
,σ2=0,0204, portanto, o intervalo de confiança de 99% é[0,865,1,053] . Isso contradiz a intuição 1.
Recorte (sugerido por @soakley nos comentários)
É fácil usar apenas a abordagem padrão e fornecer como resultado. Mas podemos fazer isso? Ainda não estou convencido de que o limite inferior permaneça constante (-> 4.)
Modelo de Regressão Logística (sugerido por @Rose Hartman)
Dados transformados: Resultando em [ 0,173 , 7,87 ] , transformando-o novamente resulta em [ 0,543 , 0,999 ] . Obviamente, o 6,90 é um valor externo para os dados transformados, enquanto o 0,99 não é para os dados não transformados, resultando em um intervalo de confiança muito grande. (-> 3.)
Intervalo de confiança da proporção binomial (sugerido por @Tim)
A abordagem parece muito boa, mas infelizmente não se encaixa no experimento. Basta combinar os resultados e interpretá-los como um grande experimento repetido de Bernoulli, conforme sugerido por @ZahavaKor, resulta no seguinte:
de 5 * 1000 no total. Alimentando isso no Ajuste. A calculadora Wald fornece [ 0,9511 , 0,9657 ] . Este não parece ser realista, porque não um único X i está dentro desse intervalo! (-> 3.)
Bootstrapping (sugerido por @soakley)
Com , temos 3125 permutações possíveis. Tomando o 3093média das permutações, obtemos[0,91,0,99]. Looks nãoqueruim, embora eu esperaria um intervalo maior (-> 3.). No entanto, é por construção nunca maior que[min(Xi),max(X . Assim, para uma amostra pequena, ela crescerá mais do que diminuirá para aumentar n (-> 2.). Isso é pelo menos o que acontece com as amostras fornecidas acima.