Eu estava (e ainda estou) realmente interessado na resposta a essa pergunta, porque essa é uma variação interessante da complexidade dos jogos que não foi resolvida, então eu ofereci uma recompensa. Eu pensei que a pergunta original provavelmente era muito difícil, então eu postei três perguntas relacionadas que também seriam dignas da recompensa. Ninguém postou nenhuma resposta antes que a recompensa expirasse. Posteriormente, fui capaz de responder a duas perguntas relacionadas (perguntas 3 e 4, discutidas abaixo na minha postagem original), mostrando que a aproximação do valor dos jogos com arbitragem com moedas semi-privadas correlacionadas (definidas abaixo) estava EXPTIME-completa. A pergunta original ainda não foi respondida. Eu também estaria interessado em quaisquer resultados colocando jogos relacionados entre PSPACE e EXPTIME em classes de complexidade interessantes.
POSTO ORIGINAL:
Essa questão foi inspirada na discussão sobre a questão hexadecimal do Itai . Um jogo de arbitragem é um jogo em que dois jogadores computacionalmente ilimitados jogam comunicando-se através de um verificador de tempo polinomial que pode jogar moedas privadas (portanto, o número de turnos e a quantidade de comunicação também são limitados no tempo polinomial). No final do jogo, o árbitro executa um algoritmo em P para determinar quem vence. Determinar quem vence esse jogo (mesmo que aproximadamente) está EXPTIME completo. Se você possui moedas públicas e comunicação pública, esses jogos estão no PSPACE. ( Veja Feige e Killian, "Tornando os jogos curtos". ) Minha pergunta diz respeito à fronteira entre esses dois resultados.
Pergunta: Suponha que você tenha dois jogadores sem limites computacionais que jogam um jogo de comprimento polinomial. O papel do árbitro é limitado a, antes de cada jogada, dar a cada jogador um certo número de jogadas privadas de moedas (sem correlação com as do outro jogador). Todos os movimentos do jogador são públicos e, portanto, são vistos pelo oponente - a única informação privada é o lançamento da moeda. No final do jogo, todos os lançamentos de moedas particulares são revelados, e o árbitro do tempo múltiplo usa esses lançamentos de moedas e os movimentos do jogador para decidir quem ganha.
Pelos resultados dos jogos arbitrados, a aproximação da probabilidade de o primeiro jogador vencer está em EXPTIME, e também é claramente difícil para o PSPACE. Qual (se houver) é? Existe algo conhecido sobre esse problema?
Observe que os jogadores podem ter que usar estratégias mistas, pois você pode jogar jogos de matriz com soma zero (à la von Neumann) dessa maneira.
MATERIAL ADICIONADO:
Vamos chamar essa classe de complexidade de RGUSP (todos os idiomas que podem ser reduzidos a um jogo com arbitragem com moedas semi-privadas não correlacionadas, conforme descrito acima, de modo que, se , jogador 1 vitórias com probabilidade ≥ 2 / 3 , e se x ∉ L , jogador 1 ganha com probabilidade ≤ 1 / 3 ). Minhas três perguntas relacionadas são:
Pergunta 2: O RGUSP parece bastante robusto. Por exemplo, se mudarmos o jogo para que o árbitro não envie mensagens, mas apenas observe as mensagens públicas dos jogadores 1 e 2 e receba delas mensagens privadas, aproximar o valor desse jogo ainda é equivalente ao RGUSP. Eu gostaria de demonstrar que o RGUSP é robusto, por isso estou disposto a dar a recompensa a qualquer pessoa que encontre uma classe C de complexidade natural para que PSPACE C ⊆ RGUSP, em que nenhuma das contenções pareça exata.
Pergunta 3: Também suspeito fortemente que a classe RGCSP (Jogos com arbitragem com moedas semi-privadas correlacionadas) esteja EXPTIME completa e também estou disposto a dar a recompensa a alguém que comprove esse fato. No RGCSP, no primeiro passo, o árbitro dá aos dois jogadores variáveis aleatórias correlacionadas (por exemplo, ele pode dar ao primeiro jogador um ponto em um grande plano projetivo e ao segundo jogador uma linha que contenha esse ponto). Depois disso, por um número polinomial de rodadas, os dois jogadores alternam o envio de mensagens públicas de tamanho poligonal. Depois que o jogo é disputado, o árbitro de tempo livre decide quem ganhou. Qual é a complexidade de aproximar a probabilidade de ganhar para o jogador 1?
Pergunta 4: Finalmente, eu tenho uma pergunta que pode realmente ser sobre distribuição de criptografia e probabilidade: dar a capacidade de executar transferências inconscientes para dois jogadores em um jogo de arbitragem com moedas semi-privadas não correlacionadas permite que eles joguem um jogo de arbitragem arbitrário com moedas correlacionadas (ou, alternativamente, ele permite que eles joguem um jogo determinando qual vencedor é EXPTIME-complete)?