Atualização : Com o benefício de uma retrospectiva de alguns anos, escrevi um tratamento mais conciso do essencialmente o mesmo material em resposta a uma pergunta semelhante.
Como construir uma região de confiança
Vamos começar com um método geral para construir regiões de confiança. Pode ser aplicado a um único parâmetro, para gerar um intervalo de confiança ou um conjunto de intervalos; e pode ser aplicado a dois ou mais parâmetros, para gerar regiões de confiança dimensional mais alta.
Afirmamos que as estatísticas observadas D originam de uma distribuição com os parâmetros θ , ou seja, a distribuição amostral s(d|θ) sobre as possíveis estatísticas d , e buscamos uma região de confiança para θ no conjunto de valores possíveis Θ . Definir uma região de maior densidade (HDR): o h -HDR de um PDF é o menor subconjunto de seu domínio que suporta a probabilidade h . Denote o h -HDR de s ( d| ψ) como Hψ , para qualquer ψ ∈ Θ . Então, aregião de confiançah paraθ , dados os dadosD , é o conjuntoCD= { ϕ : D ∈ Hϕ} . Um valor típico deh seria 0,95.
Uma Interpretação Frequentista
A partir da definição anterior de uma regi de confian segue
d∈ Hψ⟷ ip ∈ Cd
com Cd= { ϕ : d∈ Hϕ} . Agora imagine um grande conjunto de ( imaginárias observações) { DEu} , feita sob circunstâncias semelhantes a D . ie São amostras de s ( d| θ) . Como Hθ suporta a massa de probabilidade h dos PDF s ( d| θ) ,P( DEu∈ Hθ) = h para todos osEu . Por conseguinte, a fracção de{ DEu} para os quaisDEu∈ Hθ éh . E assim, usando o equivalência acima, a fracção de{ DEu} para os quaisθ ∈ CDEu também éh .
Portanto, é isso que a reivindicação freqüentista da região de confiança h para θ equivale a:
Tomar um grande número de observações imaginárias { DEu} a partir da distribuição de amostragem s ( d| θ) que deu origem ao estatísticas observada D . Então, θ fica dentro de uma fração h das regiões de confiança análogas mas imaginárias { CDEu} .
A região de confiança CD portanto, não reivindica a probabilidade de que θ esteja em algum lugar! A razão é simplesmente que não há nada na fomulação que nos permita falar de uma distribuição de probabilidade sobre θ . A interpretação é apenas uma superestrutura elaborada, que não melhora a base. A base é apenas s(d|θ) e D , onde θ não aparece como uma quantidade distribuída e não há informações que possamos usar para resolver isso. Existem basicamente duas maneiras de obter uma distribuição sobre θ :
- Atribua uma distribuição diretamente da informação disponível: p(θ|I) .
- Relacione θ a outra quantidade distribuída: p(θ|I)=∫p(θx|I)dx=∫p(θ|xI)p(x|I)dx .
Nos dois casos, θ deve aparecer à esquerda em algum lugar. Os freqüentistas não podem usar nenhum dos métodos, porque ambos exigem um prévio herético.
Uma visão bayesiana
O máximo que um bayesiano pode tirar da h região de confiança CD , dada sem qualificação, é simplesmente a interpretação direta: que é o conjunto de ϕ para o qual D enquadra no h -HDR Hϕ da distribuição amostral s(d|ϕ) . Isso não nos diz necessariamente muito sobre θ , e aqui está o porquê.
A probabilidade de que θ∈CD , dado D e a informação de base I , seja:
P(θ∈CD|DI)=∫CDp(θ|DI)dθ=∫CDp(D|θI)p(θ|I)p(D|I)dθ
Observe que, diferentemente da interpretação freqüentista, imediatamente exigimos uma distribuição sobreθ. A informação de fundoInos diz, como antes, que a distribuição de amostragem és(d|θ):
P(θ∈CD|DI)i.e.P(θ∈CD|DI)=∫CDs(D|θ)p(θ|I)p(D|I)dθ=∫CDs(D|θ)p(θ|I)dθp(D|I)=∫CDs(D|θ)p(θ|I)dθ∫s(D|θ)p(θ|I)dθ
Agora, em geral, essa expressão não é avaliada comoh, ou seja, aregião de confiançahCDnem sempre contémθcom probabilidadeh. De fato, pode ser totalmente diferente deh. Existem, no entanto, muitas situações comuns em que eleéavaliado parah, razão pela qual as regiões de confiança geralmente são consistentes com nossas intuições probabilísticas.
Por exemplo, suponha que o PDF da junta anterior de d e θ seja simétrico em que pd,θ(d,θ|I)=pd,θ(θ,d|I) . (Claramente, isso envolve a suposição de que o PDF varia sobre o mesmo domínio em d e θ .) Então, se o anterior for p(θ|I)=f(θ) , teremos s(D|θ)p(θ|I)=s(D|θ)f(θ)=s(θ|D)f(D) . Portanto,
P(θ∈CD|DI)i.e.P(θ∈CD|DI)=∫CDs(θ|D)dθ∫s(θ|D)dθ=∫CDs(θ|D)dθ
A partir da definição de um HDR sabemos que, para qualquerψ∈Θ
∫Hψs(d|ψ)ddand therefore that∫HDs(d|D)ddor equivalently∫HDs(θ|D)dθ=h=h=h
Portanto, dado ques(d|θ)f(θ)=s(θ|d)f(d),CD=HDimplicaP(θ∈CD|DI)=h. O antecedente satisfaz
CD=HD⟷∀ψ[ψ∈CD↔ψ∈HD]
Aplicando a equivalência perto do topo:
CD=HD⟷∀ψ[D∈Hψ↔ψ∈HD]
Assim, a região de confiançaCD contémθ com probabilidadeh se para todos os valores possíveisψ deθ , oh -HDR des(d|ψ) contémD , se e apenas se oh -HDR des(d|D) contémψ .
Agora, a relação simétrica D∈Hψ↔ψ∈HD é satisfeito por todos ψ quando s(ψ+δ|ψ)=s(D−δ|D) para todos δ que abrangem o suporte de s(d|D) e s(d|ψ) . Portanto, podemos formar o seguinte argumento:
- s(d|θ)f(θ)=s(θ|d)f(d) (premissa)
- ∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)] (premissa)
- ∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)]⟶∀ψ[D∈Hψ↔ψ∈HD]
- ∴∀ψ[D∈Hψ↔ψ∈HD]
- ∀ψ[D∈Hψ↔ψ∈HD]⟶CD=HD
- ∴CD=HD
- [s(d|θ)f(θ)=s(θ|d)f(d)∧CD=HD]⟶P(θ∈CD|DI)=h
- ∴P(θ∈CD|DI)=h
Vamos aplicar o argumento para um intervalo de confiança da média de uma distribuição normal 1-D (μ,σ) , dado uma amostra média x¯ a partir de n medições. Temos θ=μ e d=x¯ , de modo que a distribuição de amostragem é de
s(d|θ)=n−−√σ2π−−√e−n2σ2(d−θ)2
Suponha também que não sabemos nada sobreθantes de coletar os dados (exceto que é um parâmetro de localização) e, portanto, atribua um uniforme anterior:f(θ)=k. Claramente agora temoss(d|θ)f(θ)=s(θ|d)f(d), de modo que a primeira premissa é satisfeita. Sejas(d|θ)=g((d−θ)2) . (ou seja, pode ser escrito dessa forma.) Então
s(ψ+δ|ψ)=g((ψ+δ−ψ)2)=g(δ2)ands(D−δ|D)=g((D−δ−D)2)=g(δ2)so that∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)]
que a segunda premissa é satisfeita. Ambas as instalações sendo verdade, as ligações argumento de oito pontos nos concluir que a probabilidade de queθsitua-se no intervalo de confiançaCDéh!
Portanto, temos uma ironia divertida:
- O freqüentador que atribui o intervalo de confiança h não pode dizer que P(θ∈CD)=h , não importa quão inocentemente uniforme θ pareça antes de incorporar os dados.
- A Bayesian que não iria atribuir um h intervalo de confiança dessa forma sabe de qualquer forma que P(θ∈CD|DI)=h .
Considerações finais
Foram identificadas as condições (isto é, os dois locais) em que o h regi de confian, de facto, produzem probabilidade h que θ∈CD . Um freqüentador confunde a primeira premissa, porque envolve um prior em θ , e esse tipo de negócio é inevitável na rota para uma probabilidade. Mas para um bayesiano, é aceitável --- não, essencial. Estas condições são suficientes, mas não necessário, de forma que há muitas outras circunstâncias em que o Bayesiana P(θ∈CD|DI) é igual a h . Igualmente, porém, existem muitas circunstâncias em queP(θ∈CD|DI)≠h , especialmente quando as informações anteriores são significativas.
Nós aplicamos uma análise Bayesiana apenas como um Bayesian Would consistente, dada a informação na mão , incluindo estatísticas D . Mas um Bayesian, se ele puder, vai aplicar seus métodos para as medições brutas em vez --- ao {xi} , ao invés de x¯ . Muitas vezes, o recolhimento dos dados brutos nas estatísticas resumidas D destrói as informações nos dados; e as estatísticas resumidas são incapazes de falar de maneira tão eloquente quanto os dados originais sobre os parâmetros θ .