Mecanismo semelhante ao humano para treinamento no final do jogo


10

Estou treinando no final do jogo com o LucasChess (LC), mas o problema não está realmente relacionado ao LC, mas aos mecanismos de xadrez em geral.

Eu tenho este problema: Veja a imagem. Quando movo o Kh6 nessa posição, o motor no LC move o Ke8. Provavelmente, este é o movimento com o qual o branco precisa de mais movimentos até o companheiro.posição: w: Kh5, Pg6, Pg4, b: Kf8, branco para mover

Mas é também a mudança que facilita as coisas para o branco. Seria mais difícil para o branco se o preto movesse Kg8, tentando bloquear o peão até que não seja mais possível e talvez provocando um impasse. Em vez de bloquear, o preto foge em direção ao centro.

Suponho que o motor vê que, ao fugir para o centro, talvez seja um companheiro em 20 e sem fugir e tentar bloqueá-lo, talvez seja um companheiro em 16. Portanto, faz o movimento "ideal" com o qual a distância para o companheiro é maior. .

Mas este não é o melhor movimento humano. Porque torna mais fácil para o branco a rainha do seu peão. Ele limpa todas as possibilidades do branco cometer erros e, dessa forma, tira uma parte importante do efeito do treinamento.

Eu já vi esse comportamento em quase todos os finais de peões, não apenas neste; e também em outros finais.

Todos os mecanismos que tentei mostram esse comportamento. (Komodo, Bacalhau, Gaivota, Gaviota, Fruta)

Então, minha pergunta é: você conhece um mecanismo gratuito ou algumas configurações para um mecanismo que reproduz jogos finais como os humanos, tentando bloquear os peões o maior tempo possível, em vez de fugir com o rei para o centro?

Update: konsolas encontrado um motor (Leela ou LC0) que trata a posição determinada bem e então a princípio eu aceitei a sua resposta como a resposta. No meio, testei mais o Lc0 e cheguei à conclusão de que ele não é absolutamente utilizável para o treinamento de final de jogo, porque ele desempenha a maioria dos finais catastroficamente. Ao aceitar a resposta, eu não conseguia imaginar nenhum mecanismo jogando tão mal os jogos finais.

Quero esclarecer minha pergunta: você conhece um mecanismo gratuito ou algumas configurações para um mecanismo que, com tempo de movimento 1s ou inferior, sem precisar de uma placa de vídeo, reproduz jogos finais como humanos, tentando bloquear os peões o maior tempo possível, em vez de fugindo com o rei para o centro?

Lc0 com redes atuais ou redes destiladas do dkappe não se qualificam, porque jogam a maioria dos jogos finais de maneira horrível e absolutamente não humana em um PC sem placa gráfica. E, pelo que li, uma placa de vídeo ainda não ajudará no seu jogo final.

Atualização 2: gostaria de esclarecer que não é apenas a posição acima, mas muitas outras também. Os motores jogam o movimento que aumenta a distância para acasalar, assumindo o jogo perfeito do oponente. Exemplo 8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9, consulte a segunda figura. Os motores jogam Kf3, o que torna muito fácil para W. O que B deve jogar é Kg1, e agora é muito mais difícil para W vencer. W então precisa saber ou descobrir que ele deve permitir que B seja rainha.8/8/8 / 6K1 / 8/8 / 3Q2kp / 8 b - - 4 9


2
O mesmo problema ocorre algumas vezes quando se pratica tática em lichess. Freqüentemente, o mecanismo não executa a maior defesa de teste, pois, com a melhor jogada, é inferior a uma defesa fácil de refutar.
Qudit 8/03/19

1
Sem ofensas ... Mas 1.Rh6 Kg8 2.g7 é bem direto.
Jossie Calderon

@ Jossie C .: Sim, se você souber o tipo de posição, se souber que há um empate atrás da esquina. Mas na posição semelhante, (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8 w - - 2 2) depois de 1.Rh6, o Rg8 abre a possibilidade do Branco cometer o erro g5? retirar. Se você conhece bem a posição, não cometerá o erro. ... Mas você também não precisa treinar esse tipo de posição. Mas se você gosta de treinar essa posição e nunca se deparou com esse empate durante o treinamento, não aprendeu muito. Ainda pior. então você aprendeu que não há nada para estar ciente aqui.
Wickie

Adendo: (5k2 / 8 / 6P1 / 7K / 6P1 / 8/8/8 w - - 2 2) não é uma posição semelhante, é a minha posição original.
Wickie

1
Uma maneira de "resolver" esse problema é forçar o computador a parar de pesquisar em profundidade apenas um pouco mais do que a sua profundidade de pesquisa efetiva. Dessa forma, é improvável que perca algo que você possa ver, mas também não fará uma mudança por uma razão que apenas ele possa ver.
user21820

Respostas:


5

Os motores alfa-beta, em muitas posições de final de jogo, encontrarão rapidamente um companheiro e, portanto, escolherão a jogada que prolonga o companheiro por mais tempo.

Os motores que usam o Monte Carlo Tree Search, no entanto, escolhem a linha com as maiores chances de ganhar / empatar. Por exemplo, Lc0 , um mecanismo de rede neural que usa MCTS, sugere Kg8 conforme desejado em sua posição:

NN - NN
1 ... Rg8 2. Rf6 Rf8 3. Rg5 Rg7 4. Rf5 Rg8 5. Rf6 Rf8

Lc0 não joga jogos finais nem mecanismos alfa-beta, mas tende a jogá-los de uma maneira muito mais humana.

Eu também sugeriria dar uma olhada no Komodo 12 MCTS, que também pode exibir esse tipo de comportamento.


Na verdade, eu treinei Lc0 com pesos 36089 e joga esses jogos finais muito melhor do que qualquer outro mecanismo que eu tentei (e tentei dezenas mais no meio). Por outro lado, ele não sabe como se acasalar com o KQ-Q. Portanto, pode não ser o melhor mecanismo para o treinamento no final do jogo. No entanto, minha pergunta original foi respondida.
Wickie

1
@Wickie, o que é KQ-Q?
Pedro A

@Pedro KQ-Q é um erro do meu lado. Eu quis dizer KQ-K. Rei e rainha contra rei.
Wickie

2
Sobre o que é mesmo que você está falando? Leela podem acasalar 100% do tempo com um KQ vs K. Tem sido capaz de fazer isso por mais de um ano: docs.google.com/spreadsheets/d/...
NoseKnowsAll

1
@NoseKnowsAll Sim, ele pode combinar com o KQ-K, se você tiver coragem de esperar 30 movimentos ou mais. Pelo menos com a minha configuração (sem placa de vídeo, tempo de movimento de 1 segundo, CPU Core Duo 2.4 GHz), todas as redes que tentei jogar terrivelmente no final do jogo. Estou tendo cólicas estomacais olhando para eles. Eu tentei as redes destiladas 36089 e dkappes 11258-48x5, 11258-64x6 e 11258-80x7.
Wickie

1

O Freechess.org tem um bot chamado endgamebot contra o qual você pode jogar.

Ele conhece até 6 jogadores finais.


3
Mas ele joga como humano, qual é a questão do OP?
Glorfindel

@Glorfindel: Sim.
Jossie Calderon 16/03/19

@ Jossie Calderon: Eu gostaria de experimentar isso. Eu tenho uma conta fics e BabasChess. Como posso treinar uma certa posição com este bot? ( Ajuda bot ou ajuda endgamebot não tem resultados.)
Wickie

@ Jossie Calderon: Eu encontrei-me: tell ajuda endgamebot
Wickie

2
@ Jossie Calderon: não :-( Depois 1. KH6, KG8 abre a possibilidade para g5 erro de branco com sorteio O endgamebot toca Re7 lá, a fuga típico para o centro..
Wickie

0

Depende do mecanismo de xadrez que LC está usando, hoje em dia os mecanismos jogam de maneira muito semelhante aos movimentos do tipo humano, baixam o bacalhau 9 e o anexam ao LC, conforme o que ele está jogando. Há também um ponto importante: às vezes, o aplicativo de treinamento usa movimentos incorporados para brincar, portanto, verifique se o mecanismo está tocando e não apenas respondendo aos movimentos da notação


Eu tentei muitos motores em LC, todos mostram o comportamento do rei em fuga. Além de Leela ou Lc0, que tem outras deficiências.
Wickie
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.