Uma abordagem para a comparação de modelos em uma estrutura bayesiana usa uma variável de indicador de Bernoulli para determinar qual dos dois modelos provavelmente é o "modelo verdadeiro". Ao aplicar ferramentas baseadas no MCMC para ajustar esse modelo, é comum usar pseudo-anteriores para melhorar a mistura nas cadeias. Veja aqui um tratamento muito acessível sobre por que os pseudo-anteriores são úteis.
Em seu artigo seminal sobre o tema, Carlin & Chib (p. 475) afirmam que "a forma do [pseudo-prior] é irrelevante", que entendo como que não deve afetar a inferência posterior com base no modelo (embora isso pode afetar a mistura do MCMC durante o ajuste do modelo). No entanto, minha intuição é que a forma do pseudo-prior importa. Eu perguntei sobre isso anteriormente nesta pergunta . @ Xi'an comentou (quarto comentário): "a inferência sobre qual modelo está correto não depende dos pseudo-anteriores ".
Recentemente, li comentários de Martyn Plummer que contradizem minha compreensão de Carlin & Chib. Martyn diz: " Para que o método de Carlin-Chib funcione, o pseudo-prior deve corresponder ao posterior quando o modelo for verdadeiro " .
(NÃO estou dizendo que Plummer contradiz Carlin & Chib; apenas que ele contradiz minha compreensão da afirmação de Carlin & Chib).
Tudo isso me deixa com cinco perguntas:
- O que está acontecendo aqui? Desde que o modelo converja e produza um bom tamanho efetivo da amostra a partir do posterior, minha inferência sobre quais variáveis incluir em um modelo dependerá do meu pseudo-prior?
- Se não, como podemos comparar isso com minha intuição e o comentário de Plummer ? Em caso afirmativo, como podemos comparar isso com o artigo de Carlin & Chib e o comentário de Xi'an (4º comentário) ?
- Se minha compreensão do comentário de Plummer está correta, e os pseudo-anteriores devem corresponder ao posterior quando a variável é incluída ... isso significa que é inadmissível que os pseudo-anteriores correspondam exatamente aos verdadeiros anteriores? Isso significaria que os pseudo-anteriores são muito mais que uma técnica conveniente para melhorar a mistura no MCMC !!
E se a variável indicadora ativar e desativar uma parte do modelo com vários parâmetros (por exemplo, um efeito aleatório com uma grande média, uma variação en efeitos de grupo n )? Quais das opções a seguir são permitidas (em ordem de confiança de que a abordagem é permitida)? Existe uma abordagem melhor que eu não listo?
Eu. Use um pseudo-prior que se aproxime da distribuição posterior da articulação completa de todos os parâmetros.
ii. Se a mixagem for aceitável não atroz, não use pseudo-prioros (ex .: pseudo-anteriores equivalentes aos verdadeiros anteriores).
iii. Use um pseudo-prior com base nas distribuições posteriores univariadas para cada parâmetro, mas não se preocupe em como elas são distribuídas em conjunto.
iv. Seguindo a linguagem aparentemente simples de Carlin & Chib, use qualquer pseudo-prior que ofereça uma mistura computacionalmente eficiente nas cadeias MCMC, pois "a forma do [pseudo-prior] é irrelevante".
O que @ Xi'an significa no primeiro comentário sobre minha pergunta ao dizer " os pseudo-anteriores precisam de correção em um tipo de correção de amostragem importante " .