Eu desenvolvi a implementação padrão do ELO que pode ser encontrada aqui , mas o problema é que meus jogadores só terão entre 10 e 40 jogos em uma "temporada". Desde que minha primeira temporada já foi concluída (agora estou iniciando meu próprio sistema de classificação para o meu jogo), eu sei qual deve ser a classificação das classificações na ELO dos meus jogadores, ou pelo menos muito próxima disso. Meu problema é que, depois de implementar o algoritmo base, tenho alguns outliers que estão muito distantes.
Como eu tenho apenas 10 a 40 jogos, meu primeiro pensamento para remediar essa situação foi implementar um loop em torno desse processo, retirando a classificação ELO do resultado final de um ciclo e usá-la como ponto de partida para o próximo ciclo (para cada indivíduo jogador). Em seguida, repita esses ciclos até que o desvio médio ou máximo das classificações ELO dos ciclos anteriores aos atuais não seja maior que X. Isso ajudou a resolver alguns dos grandes valores extremos. Ainda existem alguns outliers menores com os quais ainda não me sinto confortável ...
Como exemplo, eu tenho 7 divisões, para a divisão 1, o cara que deve ser classificado como o número 1 com base no seu ELO, acaba sendo classificado em 5º, para a divisão 2, o cara que deve ser classificado como o número 1 é o 3º. Os dez primeiros ou mais para cada divisão são realmente muito próximos, exceto para esses tipos de outliers.
Como posso modificar meu algoritmo ou qual abordagem posso adotar para tentar reduzir os valores discrepantes?
Nota lateral 1. Para a divisão 1, o cara que deve ser o número 1, que acaba em 5, é na verdade o número 1 da temporada inteira pelo outro sistema de classificação. Eu simplesmente não sei como isso é calculado (e pode não ser calculado, pode ser com base, eu sei que x jogador é tão bom, então ele está no 1º lugar).
Nota lateral 2. Eu fiz uma modificação no algoritmo. Eu quero "ponderar" as vitórias / derrotas pelo quão dominantes elas foram. Se o jogador A vencer o jogador B 20-0, quero que o peso seja maior, especialmente se as classificações estiverem muito próximas, mas se as classificações estiverem mais distantes (onde a já é maior que B), a alteração da ELO não deve ser de qualquer maneira, já que se esperava que eles vencessem em primeiro lugar. Então, o que eu fiz foi, em vez de usar o fator / valor k de 400 como a fórmula original usa, eu mudei para ser 100 + ((score difference) * 2)
. Portanto, o fator k máximo seria 140 (20-0 é a maior vitória, multiplique por 2 e adicione 100).
Que outra estratégia eu poderia implementar para incluir resultados de peso e corrigir alguns desses valores extremos?
Sem ter os dados na minha frente (tudo está em casa), tentarei resumir o cenário ...
Divisão I
#1 Elo Rating of 2250
#2 Elo Rating of 2200
#3 Elo rating of 2190
#4 Elo rating of 2175
#5 Elo rating of 2170
Onde o cara nº 5 venceu o nº 1 para vencer o torneio, e seu "corpo de trabalho" parece mais completo que o nº 1 (ou seja, ele jogou contra e venceu oponentes mais fortes do que o nº 1). Talvez seja porque o fator k "ponderado" está jogando isso fora porque o # 5 teve muitas vitórias que foram de apenas 2 a 5 pontos, onde as vitórias # 1 foram por uma margem mais alta, digamos 5 a 10 pontos.
Talvez eu só precise brincar com meu fator k "ponderado" para ver se consigo obter meus resultados calculados mais próximos dos resultados reais ...