Existem N jogadores e M objetos, cada um dos objetos tem um valor. Cada jogador tem uma estratégia na escolha de um objeto. A cada rodada que um jogador escolhe um objeto, muitos jogadores podem escolher o mesmo objeto. No entanto, o valor de cada objeto é dividido igualmente entre todos os jogadores que o escolheram. Haverá 9000 rodadas (escolhas) por jogo. Nosso objetivo é maximizar os valores que acumulamos no final do jogo.
Pergunta: como criar uma função de distribuição de probabilidade para cada jogada, assumindo que suas decisões são variáveis aleatórias?
Abordagem Atual: Minha abordagem atual é contar a frequência de um jogador escolher um objeto específico e dividir pelo número total de rodadas, o que daria uma probabilidade de um jogador provavelmente escolher esse objeto específico.
Problema: com cada jogador jogando agressivamente tentando ser imprevisível possível (ruído), com a minha abordagem atual as funções de distribuição de probabilidade não são precisas (9000 rodadas não parecem ser dados suficientes). Existe uma maneira melhor de criar essas funções de distribuição?
Nota: Li em algum lugar que (modelo Bayes e HMM) são mais superiores do que as contagens de frequência, mas não sei como adaptá-lo a essa situação.