O método de Monte Carlo é uma abordagem na qual você gera um grande número de valores ou simulações aleatórias e forma algum tipo de confusão baseada nos padrões gerais, como médias e variações.
Como exemplo, você pode usá-lo para previsões meteorológicas . Prever o tempo a longo prazo é bastante difícil, porque é um sistema caótico em que pequenas mudanças podem levar a resultados muito diferentes. Usando os métodos de Monte Carlo, você pode executar um grande número de simulações, cada uma com mudanças atmosféricas ligeiramente diferentes. Depois, você pode analisar os resultados e, por exemplo, calcular a probabilidade de chuva em um determinado dia com base em quantas simulações terminaram com chuva.
Quanto ao uso de Monte Carlo no Alpha Go, eles parecem estar usando o chamado Monte Carlo Tree Search . Nesta abordagem, você faz uma árvore de possíveis movimentos, algumas voltas para o futuro e tenta encontrar a melhor sequência. No entanto, como o número de jogadas possíveis no jogo go é muito grande, você não poderá explorar muito à frente. Isso significa que alguns dos movimentos que parecem bons agora podem se tornar ruins depois.
Portanto, na Pesquisa em árvore de Monte Carlo, você escolhe uma sequência promissora de movimentos e executa uma ou mais simulações de como o jogo pode prosseguir a partir desse ponto. Em seguida, você pode usar os resultados dessa simulação para ter uma idéia melhor de quão boa é a sequência específica de movimentos e atualizar a árvore de acordo. Repita conforme necessário até encontrar uma boa jogada.
Se você quiser obter mais informações ou dar uma olhada em algumas ilustrações, encontrei um artigo interessante sobre o assunto: C. Browne et al., Uma pesquisa de métodos de pesquisa em árvores de Monte Carlo ( repositório aberto / link permanente (paywalled) )