Exemplo com 100 ensaios de Bernoulli
A construção de intervalos de confiança pode ser colocada em um gráfico de θ versus θ^ como aqui:
Podemos rejeitar uma hipótese nula com intervalos de confiança produzidos por amostragem, em vez da hipótese nula?
Na minha resposta a essa pergunta, uso o seguinte gráfico:
Observe que esta imagem é um clássico e uma adaptação de O uso da confiança ou limites fiduciais ilustrados no caso do Binomial CJ Clopper e ES Pearson Biometrika vol. 26, n. 4 (dezembro de 1934), pp. 404-413
Você pode definir um α-% de região de confiança de duas maneiras:
na direção vertical L ( θ ) < X< U( θ ) a probabilidade para os dados X, condicional ao fato de o parâmetro ser verdadeiramente θ, cair dentro desses limites é α .
na direção horizontal L ( X) < θ < U( X) a probabilidade de um experimento ter o parâmetro true dentro do intervalo de confiança é α%
Correspondência entre duas direções
Portanto, o ponto chave é que existe uma correspondência entre os intervalosL ( X) , U( X) e os intervalos L ( θ ) , U( θ ). É daí que os dois métodos vêm.
Quando você quiser L ( X) e você( X)estar o mais próximo possível ( "o mais curto possível (1 - α) nível de confiança " ), então você está tentando tornar a área de toda a região o menor possível, e isso é semelhante a obterL ( θ ) e você( θ )o mais perto possível. (mais ou menos, não há uma maneira única de obter o menor intervalo possível, por exemplo, você pode torná-lo mais curto para um tipo de observaçãoθ^ à custa de outro tipo de observação θ^)
Exemplo com θ^∼ N( μ = θ ,σ2= 1 +θ2/ 3)
Para ilustrar a diferença entre o primeiro e segundo método que ajustar o exemplo um pouco de tal modo que temos um caso em que os dois métodos de fazer divergir.
Deixe o σ não seja constante, mas sim tenha alguma relação com μ = θ θ^∼ N( μ = θ ,σ2= 1 +θ2/ 3)
então a função densidade de probabilidade para θ^, condicional em θ é f(θ^, θ ) =1 12 π( 1 +θ2/ 3)----------√e x p [- ( θ -θ^)22 ( 1 +θ2/ 3)]
Imagine esta função de densidade de probabilidade f(θ^, θ ) plotado em função de θ e θ^.
Legenda: A linha vermelha é o limite superior do intervalo de confiança e a linha verde é o limite inferior do intervalo de confiança. O intervalo de confiança é desenhado para± 1 σ(aproximadamente 68,3%). As linhas pretas grossas são o pdf (2 vezes) e a função de probabilidade que se cruzam nos pontos( θ ,θ^) = ( - 3 , - 1 ) e ( θ ,θ^) = ( 0 , - 1 ).
PDF Na direção da esquerda para a direita (constanteθ) temos o pdf para a observação θ^ dado θ. Você vê dois deles projetados (no planoθ = 7) Observe que oplimites de valores (p < 1 - α escolhido como a região de maior densidade) estão na mesma altura para um único pdf, mas não na mesma altura para diferentes PDFs (por altura, o valor de f(θ^, θ ))
Função de probabilidade Na direção de cima para baixo (constanteθ^) temos a função de probabilidade para θ dada a observação θ^. Você vê um desses projetado à direita.
Nesse caso específico, quando você seleciona a massa de 68% com a maior densidade para constantes θentão você não obtém o mesmo que selecionar a massa de 68% com a maior probabilidade de constanteθ^.
Para outras porcentagens do intervalo de confiança, você terá um ou ambos os limites em ± ∞e também o intervalo pode consistir em duas partes separadas. Portanto, obviamente não é aí que está a maior densidade da função de probabilidade (método 2). Este é um exemplo bastante artificial (embora seja simples e agradável como resulta nesses muitos detalhes), mas também para casos mais comuns, você obtém facilmente que os dois métodos não coincidem (veja o exemplo aqui em que o intervalo de confiança e o intervalo credível com um flat anterior são comparados para o parâmetro rate de uma distribuição exponencial).
Quando os dois métodos são os mesmos?
Essa horizontal versus vertical está dando o mesmo resultado, quando os limites você e eu, que limitavam os intervalos no gráfico θ vs θ^ são iso-linhas para f(θ^; θ ). Se os limites estiverem em toda parte na mesma altura que em nenhuma das duas direções, você poderá fazer uma melhoria.
(contrastando com isso: no exemplo com θ^∼ N( θ , 1 +θ2/ 3)os limites do intervalo de confiança não terão o mesmo valorf(θ^, θ ) para diferentes θ, porque a massa de probabilidade se torna mais espalhada, portanto, menor densidade, para maior | q |. Isso faz com queθl O w e θh i gh não terá o mesmo valor f(θ^; θ ), pelo menos para alguns θ^, Isso contradiz o método 2, que busca selecionar as densidades mais altas f(θ^; θ ) para um dado θ^. Na imagem acima, tentei enfatizar isso plotando as duas funções pdf relacionadas aos limites do intervalo de confiança no valorθ^= - 1; você pode ver que eles têm valores diferentes do pdf nesses limites.)
Na verdade, o segundo método não parece totalmente correto (é mais uma espécie de variação de um intervalo de probabilidade ou um intervalo credível do que um intervalo de confiança) e quando você seleciona α% de densidade na direção horizontal (limite α% da massa da função de probabilidade), então você pode depender das probabilidades anteriores .
No exemplo com a distribuição normal, não há problema e os dois métodos estão alinhados. Para uma ilustração, veja também esta resposta de Christoph Hanck . Lá, os limites são iso-linhas. Quando você muda oθ a função f(θ^, θ ) só faz uma mudança e não muda 'forma'.
Probabilidade fiducial
O intervalo de confiança, quando os limites são criados na direção vertical, são independentes das probabilidades anteriores. Este não é o caso do segundo método.
Essa diferença entre o primeiro e o segundo método pode ser um bom exemplo da diferença sutil entre probabilidade fiducial e intervalos de confiança.