Primeiro, deixe-me dizer que o teste sensível de uma hipótese aguda como requer uma distribuição prévia ponderada para , porque o fator Bayes depende criticamente disso antes. Muitos bayesianos não testam uma hipótese nítida, mas eu testarei.aa=0a
Antes de prosseguir, devo lhe dizer que realmente não entendo o que você diz que está fazendo e, portanto, posso estar dando conselhos que você não está procurando. Espero que você possa seguir a notação de maio.
Sejam dados observações: , onde (de acordo com o modelo mais geral e inclui a inclinação)
(Estou suprimindo a variável independente da lista de argumentos de condicionamento para simplificar a notação.) A probabilidade é dada por
Dado um anterior para , a distribuição posterior é
onde a probabilidade dos dados de acordo com o modelo mais geral é
y = ( ( x 1 , y 1 ) , … , ( x n , y n ) ) p ( y i |ny=((x1,y1),…,(xn,yn))x i p ( y | a , b , σ 2 ) = n ∏ i = 1 p ( y i | a , b , σ 2 ) . ( a , b , σ 2 )
p(yi|a,b,σ2)=N(yi|b+axi,σ2).
xip(y|a,b,σ2)=∏i=1np(yi|a,b,σ2).
(a,b,σ2) p ( y )p(a,b,σ2|y)=p(y|a,b,σ2)p(a,b,σ2)p(y),
p(a,b,σ2)=p(a|b,σ2)p(y)=∭p(y|a,b,σ2)p(a,b,σ)dσ2dbda=∫(∬p(y|a,b,σ2)p(b,σ2)dσ2db)p(a|b,σ2)da=∫p(y|a)p(a|b,σ2)da,
onde usei . Note-se que é a probabilidade (marginal) para e , é a anterior condicional para . Se o anterior para é independente de , então . Eu vou assumir que isso é verdade.
p ( y | a ) a p ( a | b , σ 2 ) a a ( b , σ 2 ) p ( a | b , σ 2p(a,b,σ2)=p(a|b,σ2)p(b,σ2)p(y|a)ap(a|b,σ2)aa(b,σ2)p(a|b,σ2)=p(a)
Com essas expressões, agora podemos escrever o marginal posterior para :
Vamos reorganizar essa expressão:
Como essa expressão é verdadeira para todo valor de , é verdadeira em particular para :
Observe que o numerador na fração do lado esquerdo é a probabilidade dos dados de acordo com o modelo restrito (ou seja, restrito ap ( a | ya
p(a|y)=p(y|a)p(a)p(y).
aa=0p(yp(y|a)p(y)=p(a|y)p(a).
aa=0p(y|a=0)p(y)=p(a=0|y)p(a=0).
a=0) E, como já observado, o denominador é a probabilidade dos dados de acordo com o modelo mais geral. Portanto, o lado esquerdo é o fator Bayes a favor do modelo restrito em relação ao modelo mais geral.
A fração do lado direito nos fornece uma maneira de avaliar o fator Bayes: Diz para dividir a densidade posterior avaliada em pela densidade anterior avaliada em . (A propósito, a "fórmula" é chamada de razão de densidade Savage-Dickey.) Agora é aparente por que é necessário um prévio cuidadoso para . Se deixarmos que a densidade prévia para ser muito incerto, a densidade prévia será muito baixa em todos os lugares, incluindo a , mas a densidade posterior em não vai para zero, e, consequentemente, o fator de Bayes vai para o infinito. Nesse caso, "entrada de lixo" produz "saída de lixo".a=0a=0aaa=0a=0
Você pode imaginar que, se não seguir as etapas descritas, não estará sujeito a esse problema, mas estará errado. A lógica que apresentei se aplica independentemente do "algoritmo" que você aplica.
Mas as etapas fornecem um algoritmo que pode ser útil. Suponha que o prior para os parâmetros seja dado pelo "Jeffreys prior"
Isso equivale a usar um anterior impróprio nos "parâmetros de incômodo" . Isso é bom, mas como uma prévia não seria apropriado para para a razão que eu discutido acima. Com isso, --- a probabilidade (marginal) de --- será proporcional à distribuição de Student , cujos parâmetros dependem dos dados . Esta distribuição é um resumo completo dos dados, que podem ser descartados. Agora você deve escolher um adequado e bem informado antes de( b , σ 2 ) a p ( y | a )
p(b,σ2)∝1/σ2.
(b,σ2)ap(y|a)atyta . Feito isso, você pode calcular numericamente em ambos os lados a equação "Savage-Dickey".
Espero que você encontre algo no que eu disse útil.