Alguém pode explicar a principal idéia por trás dos métodos Hamiltonianos de Monte Carlo e em quais casos eles produzirão melhores resultados do que os métodos de Markov Chain Monte Carlo?
Alguém pode explicar a principal idéia por trás dos métodos Hamiltonianos de Monte Carlo e em quais casos eles produzirão melhores resultados do que os métodos de Markov Chain Monte Carlo?
Respostas:
Acredito que a fonte mais atualizada do Monte Carlo Hamiltoniano, suas aplicações práticas e comparação com outros métodos do MCMC é este artigo de revisão datado de 2017 por Betancourt:
O desafio final na estimativa de expectativas probabilísticas é quantificar o conjunto típico da distribuição-alvo, um conjunto que se concentra próximo a uma superfície complexa no espaço de parâmetros. O Hamiltoniano Monte Carlo gera exploração coerente de distribuições de alvos suaves, explorando a geometria do conjunto típico. Essa exploração efetiva gera não apenas melhor eficiência computacional do que outros algoritmos de Monte Carlo da cadeia de Markov, mas também garantias mais fortes sobre a validade dos estimadores resultantes. Além disso, uma análise cuidadosa dessa geometria facilita estratégias de princípios para a construção automática de implementações ideais do método, permitindo que os usuários concentrem seus conhecimentos na construção de modelos melhores em vez de enfrentar as frustrações da computação estatística. Como um resultado,Stan (Stan Development Team, 2017).
O Monte Carlo Hamiltoniano ( HMC ), originalmente chamado Monte Carlo Híbrido, é uma forma de Monte Carlo da Cadeia de Markov com prazo e correções de momento.
O "hamiltoniano" refere-se à mecânica hamiltoniana.
O caso de uso está estocástica (aleatoriamente) explorando altas dimensões para integração numérica em um espaço de probabilidade.
A cadeia de Markov simples / baunilha Monte Carlo (MCMC) usa apenas o último estado para determinar o próximo estado. Isso significa que é mais provável que você avance como no espaço que já explorou.
É provável que o MCMC também se desvie para fora da área de interesse principal em espaços de alta dimensão.
Isso torna o MCMC muito ineficiente para fins de integração numérica em um espaço de probabilidade multidimensional.
Ao adicionar um termo de momento, o HMC torna a exploração do espaço de probabilidade mais eficiente, pois agora você tem mais chances de avançar com cada etapa do seu espaço de probabilidade.
O HMC também usa correções de Metropolis-Hastings para garantir que permaneça e explore a região de maior probabilidade.
Ao escrever esta resposta, achei esta apresentação no HMC bastante esclarecedora.