verificar um posterior é adequado


7

Há um problema de lição de casa em um livro que pede para verificar a propriedade de uma certa distribuição posterior, e estou tendo um pequeno problema com isso. A configuração é que você tem um modelo de regressão logística com um preditor e um uniforme inadequado antes de .R2

Especificamente, assumimos para que portanto a probabilidade é O problema é que suspeito que esse posterior seja realmente impróprio.i=1,,k

yiα,β,xiBinomial(n,invlogit(α+βxi)),
p(yα,β,x)=i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.

Para a situação específica em que , se usarmos a alteração das variáveis e , podemos ver que Na linha do asterisco, assumimos que 0 <y <n , mas, se não, então terminamos com a mesma coisa.k=1s1=invlogit(α+βx)s2=β

R2p(yα,β,x)dαdβ=R2[invlogit(α+βx)]y[1invlogit(α+βx)]nydαdβ=01s1y1(1s1)ny1ds1ds2(*)=B(y,ny)1ds2=.
0<y<n

Estou fazendo algo bobo aqui? Ou isso é um posterior impróprio?


2
À primeira vista - sem considerar os detalhes -, é surpreendentemente estranho que (a) você integre valores positivos e negativos de β e (b) um fator de 1/β não apareça quando você altera variáveis. Talvez, então, um pouco de atenção à mecânica da integração resolva seu problema.
whuber

Não fiz nenhuma matemática para apoiar isso, mas tanto minha intuição quanto minha memória dizem que você está certo e que o posterior não precisa ser adequado. Por analogia, se você fixar , um plano anterior em é o anterior de Haldane, que nem sempre leva a posteriores adequados. β=0α
cara

2
Para , é possível ver diretamente da sua equação a probabilidade de que a densidade posterior seja constante ao longo das combinações de parâmetros para as quais assume valores constantes. Portanto, o posterior é realmente impróprio e tem a forma de uma crista para . Basicamente, qualquer linha de regressão ajustada à resposta observada em ajustará os dados. Mas para , eu ficaria surpreso se o posterior não for adequado, exceto em casos degenerados como ou em casos de separação linear. k=1p(α,β|y1,x1)α+βxik=1x1k>1x1=x2
Jarle Tufto 6/02/19

11
@ Xi'an é aí que as s veio1
Taylor

3
A explicação de @JarleTufto é completamente clara: a distribuição de depende apenas de , portanto, não pode trazer informações sobre e . Daí uma posterior imprópria. Também há um problema para mais observações se todos os forem todos iguais a ou todos iguais a . Yα+βxα βyi0n
Xian

Respostas:


3

Para , é possível ver diretamente da sua equação a probabilidade de que a densidade posterior seja constante ao longo de linhas paralelas nas quais assume valores constantes. Portanto, o posterior é realmente impróprio e tem a forma de uma crista para . Basicamente, qualquer linha de regressão adequada à resposta observada em sairá igualmente bem.𝑘=1𝑝(𝛼,𝛽|𝑦1,𝑥1)𝛼+𝛽𝑥𝑖𝑘=1𝑥1

Em seguida, suponha que temos observações. Considere a reparameterização dada por Como essa é uma transformação linear de com um determinante constante do anterior para também é uniforme sobre , desde que . Considere a reparameterização adicional, a transformação inversa do logit para . Claramente, também são a priori independentes, com densidades dadas por k=2

η1=α+βx1η2=α+βx2
α,βη1,η2R2x1x2
pi=11+eηi,
i=1,2p1,p2
π(pi)=π(ηi)|dηidpi|ddpilnpi1pi=1(1pi)pi
Estes são chamados de anteriores inadequados de Haldane , que podem ser interpretados como uma certa forma de limite da densidade de uma distribuição Beta, com ambos os parâmetros próximos de zero. Condicional nos dados , desde que , a densidade marginal posterior de cada seja distribuições Beta apropriadas com os parâmetros . Retrotransformando, as distribuições posteriores de e também devem ser adequadas. Isso ocorre, exceto em casos especiais, como umy1,y20<yi<npiyi,nyi(η1,η2)(α,β)yiassumindo um valor de 0 ou nesse caso, a função beta normalizante é infinita e a parte posterior de (e, portanto, a parte posterior de e ) é inadequada.nB(yi,nyi)piαβ

Para observações , a posterior também deve ser adequada, pois a densidade posterior não normalizada de é limitada pela posterior com base nas primeiras observações .k>2α,βk=2


Não tenho certeza de que nossas duas respostas estejam em desacordo matematicamente. Estou dizendo que a integral é infinita quando cada , e você está dizendo que a integral é finita sempre que todo estiver estritamente entre os pontos finais. Além disso, isso pode ser algo que depende de quem você pergunta, mas fiquei com a impressão de que, se um posterior não for adequado para todos os pontos de dados possíveis, ele será definido como "impróprio". O prior de Haldane é um exemplo em que isso acontece. yi=nyi
Taylor

Mas suas desigualdades dizem que a integral do posterior não normalizado (para qualquer ) (o lado esquerdo da primeira desigualdade) é infinita, portanto há um desacordo. Não tenho certeza, mas o último passo que combina as duas integrais parece envolver não apenas o que você definiu como e mas também etc. etc. esse é o erro. yis1s2invlogit(α+βx(n))
Jarle Tufto 14/02/19

11
sim, você está certo. Os integrandos são diferentes nesses dois lugares, portanto você não pode combiná-los.
Taylor

Infelizmente, isso assume que é o caso mais comum. n>1
21419 Taylor

2

É impróprio, eu acredito. Eu só preciso provar que Denotar função Agora que é uma função monotonicamente crescente, quando , temos

αRβ>0p(yα,β,x)=+.
σ=invlogit
σβ>0
σ(α+βxi)>σ(αβmax|xi|)>0,
1σ(α+βxi)>1σ(α+βmax|xi|)>0.

Assim, a integral

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]yi[1σ(α+βmax|xi|)]niyi>αRβ>0[σ(αβmax|xi|)]maxni[1σ(α+βmax|xi|)]maxni>αRβ>0[σ(αβmax|xi|)]kmaxni[1σ(α+βmax|xi|)]kmaxni

São necessárias mais propriedades sobre : σ

(σ(x))N=1(1+ex)N>12N(max{1,ex})N=12N(max{1,eNx})>12Nσ(Nx)

Seja, , em seguida, ξ=αβmax|xi|η=α+βmax|xi|,N=kmaxni

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]N[1σ(α+βmax|xi|)]N<ξ<η<+[σ(ξ)]N[σ(η)]N>122Nξ+(+σ(Nξ)dξ) σ(Nη)dη=+


11
Eu fiz uma edição. Espero que esteja certo.
Silly Song

11
No segundo último passo, acho que os limites da integral dupla estão errados. Em vez disso, recebo Usando o Maple, acho que essa integral dupla é finita e é igual a . Então, tudo o que você pode dizer com base em sua derivação é que a constante de normalização da parte posterior de é maior que algo finito.
σ(Nη)ησ(Nξ)dξdη
π/(6N2)α,β
Jarle Tufto 01/03/19

1

Eu já aceitei uma resposta, mas queria ressaltar que o posterior não é adequado para todos os conjuntos de dados possíveis. O posterior é proporcional à probabilidade, que é Se , isso simplifica para

i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.
y1=y2==yk=n
i=1k[invlogit(α+βxi)]n,

e podemos ver que

i=1k[invlogit(α+βxi)]ndαdβ0i=1k[invlogit(α+βxi)]ndαdβ0[invlogit(α+βx(1))]nkdαdβ0[invlogit(r1)]nkdr1dr2=.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.