Ao obter amostras do MCMC para inferir um parâmetro específico, quais são os bons guias para o número mínimo de amostras efetivas que se deve buscar?
E esse conselho muda à medida que o modelo se torna mais ou menos complexo?
Ao obter amostras do MCMC para inferir um parâmetro específico, quais são os bons guias para o número mínimo de amostras efetivas que se deve buscar?
E esse conselho muda à medida que o modelo se torna mais ou menos complexo?
Respostas:
A pergunta que você está fazendo é diferente de "diagnóstico de convergência". Digamos que você executou todos os diagnósticos de convergência (escolha seu (s) favorito (s)) e agora está pronto para iniciar a amostragem a partir do posterior.
Existem duas opções em termos de tamanho efetivo da amostra (ESS), você pode escolher um ESS univariado ou um ESS multivariado. Um ESS univariado fornecerá um tamanho de amostra eficaz para cada parâmetro separadamente, e os métodos conservadores determinam que você escolha a menor estimativa. Este método ignora todas as correlações cruzadas entre componentes. Provavelmente é isso que a maioria das pessoas usa há um tempo
Este artigo recente fornece um limite inferior teoricamente válido do número de amostras efetivas necessárias. Antes da simulação, você precisa decidir
> minESS(p = 20, alpha = .05, eps = .05)
[1] 8716
Isso vale para qualquer problema (sob condições de regularidade). A maneira como esse método se adapta de um problema para outro é que a mistura lenta das cadeias de Markov leva mais tempo para atingir esse limite inferior, uma vez que o mESS será menor. Portanto, agora você pode verificar algumas vezes usando multiESS
se sua cadeia de Markov atingiu esse limite; se não for, pegue mais amostras.
multiESS
foi codificada para outros idiomas, como o MATLAB? (ou seria difícil reimplementar?)
A convergência depende de várias coisas: o número de parâmetros, o modelo em si, o algoritmo de amostragem, os dados ...
Eu sugeriria evitar qualquer regra geral e empregar algumas ferramentas de diagnóstico de convergência para detectar um número apropriado de iterações de redução e redução de volume em cada exemplo específico. Veja também http://www.johnmyleswhite.com/notebook/2010/08/29/mcmc-diagnostics-in-r-with-the-coda-package/
, http://users.stat.umn.edu/~geyer/mcmc/diag.html
.