Por que o sistema de classificação Elo usa a regra de atualização errada?


10

O sistema de classificação Elo usa um algoritmo de minimização de descida de gradiente da função de perda de entropia cruzada entre a probabilidade esperada e observada de um resultado em comparações pareadas. Podemos escrever as funções gerais de perda como

E=n,ipiLog(qi)

onde a soma é realizada sobre todos os resultados todos os oponentes . é a frequência observada do evento e a frequência esperada.inpiiqi

No caso de apenas dois resultados possíveis (ganhar ou perder) e um oponente, temos

E=pLog(q)(1p)Log(1q)

Se é o ranking do jogador e é o ranking do jogador podemos construída a probabilidade esperada como seguida, a regra de atualização de descida do gradiente informa o usoπiiπjj

qi=eπieπi+eπj
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

onde e são a probabilidade esperada e observada de vitória do jogador contra o jogador . Estas são as regras de atualização.qipiijtwo outcomes

Na presença de empates, podemos generalizar o modelo acima, incluindo e terceiro resultado com probabilidade

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

E podemos construir a função Perda como

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

onde são, respectivamente, a probabilidade observado de , e e a probabilidade esperada de , e . Neste último caso, a regra de atualização seriap(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

onde e são a probabilidade esperada de o jogador vencer e empatar contra o jogador . E onde e são a probabilidade observada de o jogador vencer e empatar contra o jogador . Esta é a regra de atualização.qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

A questão é: por que o sistema de classificação Elo usa as two outcomesregras de atualização mesmo na presença de empates?

Respostas:


3

A probabilidade de desenhar, ao contrário de ter um resultado decisivo, não é especificada no sistema Elo. Em vez disso, um empate é considerado - tanto no desempenho esperado quanto no resultado da partida - meia vitória e meia derrota.

Um exemplo da página Elo na Wikipedia : "A pontuação esperada de um jogador é sua probabilidade de ganhar mais a metade de sua probabilidade de empate. Portanto, uma pontuação esperada de 0,75 pode representar 75% de chance de ganhar, 25% de chance de perder e 0% de chance Por outro lado, poderia representar 50% de chance de ganhar, 0% de chance de perder e 50% de chance de empatar. "

A probabilidade de desenhar, como eu disse, não é especificada e leva a uma two outcomeregra de atualização simples , , na qual ; portanto, após uma única partida, (vitória) ou (empate, como meia vitória) ou (derrota).RA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Como o Elo, o sistema Glicko não modela os empates, mas faz uma atualização como a média de uma vitória e uma perda (por jogador). Em vez disso, no sistema de classificação TrueSkill , "os empates são modelados assumindo que a diferença de desempenho em um jogo específico é pequena. Portanto, a chance de empate depende apenas da diferença da força de jogo dos dois jogadores. No entanto, descobertas empíricas no jogo do xadrez mostra que os sorteios são mais prováveis ​​entre jogadores profissionais do que iniciantes. Portanto, a chance de desenhar também parece depender do nível de habilidade ".

Essa abordagem requer modelagem específica diferente para todos os jogos (e o TrueSkill é aplicado a alguns jogos do Microsoft Xbox), por isso é adequado para Elo e Glicko (projetado apenas para xadrez), e não para classificação , nosso sistema de classificação multiuso.


"A pontuação esperada de um jogador é a probabilidade de ganhar mais a metade da probabilidade de empate." é exatamente o que eu encontrei na fórmula acima. De qualquer forma, na fórmula de atualização do Elo, a metade da probabilidade de empate não é especificada como você está apontando. A questão permanece: por que no sistema de classificação Elo não nos preocupamos com empates?
Emanuele

11
Você sempre pode expressar a pontuação esperada como a chance de ganhar e a chance de perder (e nenhuma chance de empate - veja o primeiro exemplo da Wikipedia). Nesse caso, 'a pontuação esperada de um jogador é sua probabilidade de ganhar' (e mais ainda, porque a metade da probabilidade de empate é zero). Após uma única partida, o resultado é uma vitória, ou uma derrota, ou meia vitória. Mesmo se você tiver um jogo em que os sorteios são permitidos, você pode atualizar a pontuação do Elo usando apenas uma combinação de vitória e derrota, como se os empates não tivessem chance.
Tomaso Neri 15/02
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.