Quero começar com um cenário que me fez pensar sobre o desempenho do MCTS: Vamos supor que exista uma ação que ainda não foi adicionada à árvore de pesquisa. São algumas camadas / movimentos muito profundos. Mas se jogarmos esse lance, o jogo será basicamente ganho. No entanto, vamos supor também que todas as jogadas que poderiam ser feitas no estado do jogo são muito ruins. Por uma questão de argumento, digamos que existem 1000 movimentos possíveis e apenas um deles é bom (mas muito bom) e o resto é muito ruim. O MCTS não deixaria de reconhecer isso e nãoaumentar a árvore de pesquisa em direção a esse movimento e também avaliar muito mal essa subárvore? Eu sei que o MCTS eventualmente converge para o minimax (e eventualmente ele construirá a árvore inteira se houver memória suficiente). Então, ele deve saber que a mudança é boa, embora haja muitas possibilidades ruins. Mas acho que na prática isso não é algo em que se possa confiar. Talvez alguém possa me dizer se esta é uma avaliação correta da minha parte.
Além deste cenário especial, eu também gostaria de saber se existem outros cenários em que o MCTS terá um desempenho ruim (ou extraordinário).