≠
A função de verossimilhança e o intervalo de confiança associado não são os mesmos (conceito) que uma probabilidade posterior bayesiana construída com um prior que especifica uma distribuição uniforme.
Nas partes 1 e 2 desta resposta, argumenta-se por que a probabilidade não deve ser vista como uma probabilidade posterior bayesiana com base em um plano anterior.
Na parte 3, é apresentado um exemplo em que o intervalo de confiança e o intervalo credível variam amplamente. Também é apontado como essa discrepância surge.
1 Comportamento diferente quando a variável é transformada
fx(x)fξ(ξ)ξx=χ(ξ)
fξ(ξ)=fx(χ(ξ))dχdξdξ
x¯≠χ(ξ¯)xmaxf(x)≠χ(ξmaxf(ξ))
A função de probabilidade não se transforma dessa maneira . Este é o contraste entre a função de probabilidade e a probabilidade posterior. A função de probabilidade (máxima da) permanece a mesma quando você transforma a variável.
Lξ(ξ)=Lx(χ(ξ))
Relacionado:
O plano anterior é ambíguo . Depende da forma da estatística específica.
Por exemplo, se é distribuído uniformemente (por exemplo, , então não é uma variável distribuída uniforme.XU(0,1))X2
Não há um único plano anterior ao qual você possa relacionar a função Probabilidade. É diferente quando você define o plano anterior para ou alguma variável transformada como . Pela probabilidade dessa dependência não existir.XX2
Os limites das probabilidades (intervalos de credibilidade) serão diferentes quando você transformar a variável (para funções de probabilidade, esse não é o caso) . Por exemplo, para algum parâmetro e uma transformação monotônica (por exemplo logaritmo), obtém os equivalentes intervalos de probabilidade
af(a)aminf(amin)<<af(a)<<amaxf(amax)
2 Conceito diferente: os intervalos de confiança são independentes dos anteriores
Suponha que você faça uma amostra de uma variável de uma população com o parâmetro (desconhecido) que (a população com o parâmetro ) é amostrada de uma superpopulação (com valores possivelmente variáveis para ).Xθθθ
Pode-se fazer uma afirmação inversa tentar inferir o que o original pode ter sido baseada na observação de alguns valores para a variável .θxiX
- Os métodos bayesianos fazem isso supondo uma distribuição prévia para a distribuição de possíveisθ
- Isso contrasta com a função de probabilidade e o intervalo de confiança, que são independentes da distribuição anterior.
O intervalo de confiança não usa informações anteriores, como o intervalo credível (confiança não é uma probabilidade).
Independentemente da distribuição anterior (uniforme ou não), o intervalo x% de confiança conterá o parâmetro true em dos casosx (intervalos de confiança referem-se à taxa de sucesso, erro tipo I, do método, não de um caso particular) .
No caso do intervalo credível, esse conceito ( de tempo em que o intervalo contém o parâmetro true) nem é aplicável, mas podemos interpretá-lo em um sentido freqüentista e, em seguida, observamos que o intervalo credible conterá apenas o parâmetro true do tempo em que o anterior (uniforme) está descrevendo corretamente a superpopulação de parâmetros que podemos encontrar. O intervalo pode efetivamente ter um desempenho maior ou menor que x% (não que isso importe, pois a abordagem bayesiana responde a perguntas diferentes, mas é apenas para observar a diferença).x
3 Diferença entre confiança e intervalos credíveis
No exemplo abaixo, examinamos a função de probabilidade para a distribuição exponencial em função do parâmetro de taxa , a média da amostra e o tamanho da amostra :λx¯n
L(λ,x¯,n)=nn(n−1)!xn−1λne−λnx¯
essas funções expressam a probabilidade de observar (para um dado e ) uma média da amostra entre e .nλx¯x¯+dx
nota: o parâmetro de taxa vai de a (diferente da OP 'solicitação' de a ). O prior neste caso será um prior impróprio . Os princípios, no entanto, não mudam. Estou usando essa perspectiva para facilitar a ilustração. Distribuições com parâmetros entre e geralmente são distribuições discretas (difíceis de desenhar linhas contínuas) ou uma distribuição beta (difícil de calcular)λ0∞0101
A imagem abaixo ilustra essa função de probabilidade (o mapa colorido em azul), para o tamanho da amostra , e também desenha os limites dos intervalos de 95% (confiança e credibilidade).n=4
Os limites são criados obtendo a função de distribuição cumulativa (unidimensional). Mas, essa integração / acumulação pode ser feita em duas direções .
A diferença entre os intervalos ocorre porque as áreas de 5% são feitas de maneiras diferentes.
O intervalo de confiança de 95% contém valores para os quais o valor observado ocorreria pelo menos em 95% dos casos. Nesse caminho. qualquer que seja o valor , somente julgaremos errado em 95% dos casos.λx¯λ
Para qualquer você tem norte e sul dos limites (alterando ) 2,5% do peso da função de probabilidade.λx¯
O intervalo de 95% credível contém valores que provavelmente causam o valor observado (dado um plano anterior).λx¯
Mesmo quando o resultado observado tiver menos de 5% de probabilidade para um dado , o pode estar dentro do intervalo credível. No exemplo em particular, valores mais altos de são 'preferidos' para o intervalo credível.x¯λλλ
Para qualquer você tem oeste e leste dos limites (alterando ) 2,5% do peso da função de probabilidade.x¯λ
Um caso em que o intervalo de confiança e o intervalo credível (com base no anterior impróprio) coincidem é para estimar a média de uma variável distribuída gaussiana (a distribuição é ilustrada aqui: https://stats.stackexchange.com/a/351333/164061 ).
Um caso óbvio em que o intervalo de confiança e o intervalo credível não coincidem é ilustrado aqui ( https://stats.stackexchange.com/a/369909/164061 ). O intervalo de confiança para este caso pode ter um ou até ambos os limites (superior / inferior) no infinito.