Por que os especialistas em xadrez ficaram surpresos com a vitória do AlphaZero contra o Stockfish?

10

Foi recentemente trazido à minha atenção que os especialistas de xadrez levou o resultado deste jogo já famoso como algo de uma virada.

Veja: O novo melhor jogador do xadrez é um algoritmo destemido e irresistível

Como não especialista em IA do xadrez e do xadrez, minha suposição era que, com base no desempenho do AlphaGo e na validação desse tipo de método em relação aos jogos combinatórios, era que a IA mais antiga não teria chance.

Por que a vitória do AlphaZero foi surpreendente?

chess alphazero

— DukeZhou
fonte

14

Boa pergunta.

Antes de mais nada, em Go deepmind não havia oponentes sobre-humanos para desafiar. Os motores Go não estavam nem perto do nível mais alto dos principais jogadores humanos. No xadrez, no entanto, os motores são 500 pontos ELO mais fortes que os principais jogadores humanos. Esta é uma diferença enorme. A quantidade de trabalho investido nos motores de xadrez contemporâneos é impressionante. Estamos falando de milhões de horas em programação, centenas de milhares de iterações. É um corpo massivo de conhecimento e trabalho. Superar e superar tudo isso em 4 horas é impressionante.

Em segundo lugar, não é tanto o resultado em si que surpreende os mestres do xadrez, mas a forma como o AlphaZero joga xadrez. É bastante irônico que um sistema que não tinha conhecimento ou experiência humana seja o mais importante. Os motores são famosos por jogar movimentos feios, sem harmonia etc. É difícil explicar para um jogador que não é xadrez, mas existe um "movimento artificial", como os motores contemporâneos costumam fazer. AlphaZero não joga assim. Tem um estilo muito humano, onde domina as peças do oponente com um jogo estratégico profundo e sacrifícios impressionantes de posição. O AlphaZero funciona da maneira que almejamos, combinando profundo entendimento posicional com a precisão do cálculo de motores.

Editar Oh, e eu esqueci de mencionar algo sobre o resultado em si. Se você não está familiarizado com o xadrez do computador, pode não parecer impressionante, mas é.

Atualmente, as margens de vitória que separam os principais motores contemporâneos são muito finas. Em uma partida de 100 jogos, você pode esperar um resultado como 85 jogos sorteados, 9 vitórias e 6 derrotas para determinar o melhor mecanismo.

O AlphaZero 28 vitórias e 72 empates com zero derrotas foi esmagador de outro mundo e era completamente impensável até o momento em que aconteceu.

— Chris D
fonte

Boa resposta. Seu ponto de vista sobre a comparação entre o re Chess da IA é interessante em termos da limitação baseada na curvatura do xadrez e na tríade Win / Loss / Draw. (Possivelmente, no futuro, precisaremos de jogos finitos e intratáveis que permitam uma análise mais granular em termos de resultados.) Conheço a história dos mecanismos de xadrez e a enorme quantidade de esforço e conhecimento humano que foram usados neles, mas o contexto da falta de sucesso re: o muito mais complexo 19x19 Go tinha uma ramificação oposta para mim.

— DukeZhou

Especificamente, minha suposição era que, se o AlphaGo pudesse derrotar os melhores humanos no jogo significativamente mais complexo, parecia razoável que vencesse não apenas os melhores humanos, mas também as melhores IAs anteriores em qualquer outro jogo.

— DukeZhou

A parte sobre movimentos artificiais é bastante importante, e não é algo sobre o qual eu vi jogadores não-xadrez falarem. +1

— Stella Biderman 14/02

4

O MCTS para xadrez havia sido experimentado na literatura com pouco sucesso. Supunha-se que a abordagem da AlphaGo nunca funcionaria no xadrez, talvez em Go, mas não no xadrez. De repente, o Google anunciou que a abordagem estava funcionando e estava superando o programa de xadrez mais forte do mundo por uma margem muito significativa.

Antes do Google, todos os programadores de xadrez eram ensinados a criar heurísticas na programação de motores, uma estratégia melhor do que o aprendizado de máquina. Não importa como você implementou redes neurais, ele nunca seria executado mais rápido do que várias instruções de placas de bit de 64 bits. O AlphaGo estava muito lento , mas jogava xadrez mais forte.

— Olá Mundo
fonte

2

Vejo, com base nos artigos que você fornece, muitos níveis de surpresa na vitória:

O xadrez é um jogo difícil de dominar e a contraparte possuía as melhores práticas do mundo, AlphaZero tinha tabula rasa.

O aprendizado levou quatro horas e o AlphaZero não perdeu 100.

O estilo de tocar era uma mistura alienígena de movimentos humanos e computacionais, agressivos e algumas vezes parecendo bobos com sacrifícios que não fazem ideia, mas estão realmente tornando o status futuro mais forte.

A quantidade de possibilidades levadas em consideração por jogada foi menor que a contraparte. AlphaZero tinha uma intuição ou um sentimento misterioso.

A sensação de aborrecimento veio da quantidade de material de treinamento que a AlphaZero havia construído e do prazo, que talvez não desse à máquina tradicional uma quantidade razoável de tempo.

— mico
fonte

Aaah. Por isso, surgiu da falta de confiança no novo método de IA. Isso faz sentido.

— DukeZhou