Há uma resposta "teórica" e uma resposta "pragmática".
Do ponto de vista terórico, quando um prioritário é impróprio, o posterior não existe (bem, observe a resposta de Mateus para uma afirmação mais sólida), mas pode ser aproximado por uma forma limitadora.
Se os dados compreenderem uma amostra condicionalmente da distribuição Bernoulli com o parâmetro , e tiver a distribuição beta com os parâmetros e , a distribuição posterior de será a distribuição beta com os parâmetros ( observações, sucessos) e sua média é . Se usarmos a distribuição beta imprópria (e irreal) antes dos parâmetros de hype anteriores e fingirmos queθ α β θ α + s , β + n - s n s ( α + s ) / ( α + β + n ) α = β = 0 π ( θ ) ∝ θ - 1 ( 1 - θ ) - 1 θ s - 1 ( 1 - θ ) n - sθθαβθα+s,β+n−sns(α+s)/(α+β+n)α=β=0π( θ ) ∝ θ- 1( 1 - θ )- 1, obtemos uma proporcional posterior adequada a , ou seja, o pdf da distribuição beta com parâmetros e exceto por um fator constante. Esta é a forma limitadora do posterior para um beta anterior com os parâmetros e (Degroot & Schervish, Exemplo 7.3.13). sn-sα→0β→0θs - 1( 1 - θ )n - s - 1sn - sα → 0β→ 0
Em um modelo normal com média , variação conhecida e uma distribuição anterior para , se a precisão anterior, , é pequeno em relação à precisão dos dados, , então a distribuição posterior é aproximadamente como se :
ou seja, a distribuição posterior é aproximadamente a que resultaria da suposição de que é proporcional a uma constante paraσ 2 N ( μ 0 , τ 2 0 ) θ 1 / τ 2 0 n / σ 2 τ 2 0 = ∞ p ( θ ∣ x ) ≈ N ( θ ∣ ˉ x , σ 2 / n ) p ( θ ) θ ∈ ( - ∞ , ∞ ) τ 2 0θσ2N( μ0 0, τ20 0)θ1 / τ20 0n / σ2τ20 0= ∞
p ( θ ∣ x ) ≈ N( θ ∣ x¯, σ2/ n)
p ( θ )θ∈(−∞,∞), uma distribuição que não é estritamente possível, mas a forma limitadora do posterior à medida que aproxima de existe (
Gelman et al. , p. 52).
τ20∞
Do ponto de vista "pragmático", quando
seja qual for o , portanto, se em
, então . Priores impróprios podem ser empregados para representar o comportamento local da distribuição anterior na região onde a probabilidade é apreciável, digamos . Supondo que, para uma aproximação suficiente, um anterior siga formas como ou somente acima dep ( x ∣ θ ) = 0 p ( θ ) p ( x ∣ θ ) ≠ 0 ( a , b ) ∫ ∞ - ∞ p ( x ∣ θ ) p ( θ ) d θ = ∫ b a p ( x ∣p(x∣θ)p(θ)=0p(x∣θ)=0p(θ)p(x∣θ)≠0(a,b)( um , b ) f ( x ) = k , x ∈ ( - ∞ , ∞ ) f ( x ) = K x - 1 , x ∈ ( 0 , ∞ ) ( um , b ) θ U ( - ∞ , ∞ ) ( a ,∫∞−∞p(x∣θ)p(θ)dθ=∫bap(x∣θ)p(θ)dθ(a,b)f(x)=k,x∈(−∞,∞)f(x)=kx−1,x∈(0,∞)(a,b), para que zero caia adequadamente fora desse intervalo, garantimos que os anteriores realmente usados sejam adequados ( Box e Tiao , p. 21). Portanto, se a distribuição anterior de for mas
estiver limitada, será como se , ou seja, . Para um exemplo concreto, é o que acontece em Stan : se nenhum prior é especificado para um parâmetro, ele recebe implicitamente um uniforme anterior em seu suporte e isso é tratado como uma multiplicação da probabilidade por uma constante.θU(−∞,∞)θ ∼ U ( a , b ) p ( x ∣ θ ) p ( θ ) = p ( x ∣ θ ) k ∝ p ( x ∣ θ )(a,b)θ∼U(a,b)p(x∣θ)p(θ)=p(x∣θ)k∝p(x∣θ)