Houve estudos em larga escala dos métodos MCMC que comparam o desempenho de vários algoritmos diferentes em um conjunto de densidades de teste? Estou pensando em algo equivalente ao artigo de Rios e Sahinidis (2013), que é uma comparação completa de um grande número de otimizadores de caixa preta sem derivativos em várias classes de funções de teste.
Para o MCMC, o desempenho pode ser estimado em, por exemplo, número efetivo de amostras (ESS) por avaliação de densidade ou em alguma outra métrica apropriada.
Alguns comentários:
Compreendo que o desempenho dependerá fortemente dos detalhes do pdf de destino, mas um argumento semelhante (possivelmente não idêntico) vale para otimização e, no entanto, existe uma infinidade de funções, suítes, competições, documentos, etc. de benchmark que tratam da otimização de benchmarking algoritmos.
Além disso, é verdade que o MCMC difere da otimização, pois comparativamente é necessário muito mais cuidado e ajuste do usuário. No entanto, agora existem vários métodos de MCMC que requerem pouco ou nenhum ajuste: métodos que se adaptam na fase de queima, durante a amostragem ou métodos de vários estados (também chamados de conjunto ) (como Emcee ) que evoluem várias cadeias de interação e usam informações de outras cadeias para orientar a amostragem.
Estou particularmente interessado na comparação entre os métodos padrão e multiestado (também conhecido como ensemble). Para a definição de multiestado, consulte a Seção 30.6 do livro de MacKay :
Em um método multiestado, vários vetores de parâmetros são mantidos; eles evoluem individualmente sob movimentos como Metropolis e Gibbs; também há interações entre os vetores.
- Esta pergunta teve origem aqui .
Atualizar
- Para uma visão interessante sobre os métodos de vários estados, também conhecidos como ensemble, consulte este post de Bob Carpenter no blog de Gelman e meu comentário referente a este post de CV.