Essa recente questão da teoria dos jogos me fez pensar (isso é tangente, é claro): É possível otimizar eficientemente uma estratégia pessoal para escolher questões de pesquisa para trabalhar no uso da teoria dos jogos?
Para avançar para uma formalização da pergunta, farei as seguintes suposições (declaradas informalmente):
- Eu "aprecio" igualmente qualquer problema específico disponível para eu trabalhar (a fim de evitar a resposta "suave" (e correta!) De "Faça o que quiser!").
- Posso ou não ser bem-sucedido em encontrar uma resposta para qualquer problema em que opto por trabalhar. Para qualquer problema, tenho uma estimativa da probabilidade de ser bom em resolver um problema (depois de investir tempo nele).
- Meu objetivo é maximizar minha recompensa ao ser avaliado abaixo (candidatar-me a um emprego, candidatar-se a uma vaga, candidatar-se a uma bolsa de estudos etc.), que é uma função de quantos problemas eu resolvo e da importância ou dificuldade dos problemas. . Não tenho uma ideia clara dos pagamentos exatos por problema, mas posso fazer uma estimativa razoável.
- Existe uma relação inversa frouxa entre retorno do problema e dificuldade do problema. Outra afirmação do meu objetivo é "brincar" com as diferenças (ou seja, procurar "frutas baixas").
- Uma instância desse problema geral é especificada por uma lista de perguntas de pesquisa (possivelmente em número infinito), às quais anexo firmemente (sem custo computacional; é dado como entrada) uma estimativa do valor da pergunta e da dificuldade da pergunta. Estou jogando esse jogo contra um adversário (a pessoa que está me avaliando); a natureza decide, dada a probabilidade de eu resolver um determinado problema, se eu o resolvo com sucesso depois de optar por tentar.
Em um esforço para realmente formalizar o que está acontecendo (e evitar respostas desinteressantes ou argumentativas / do tipo discussão), verei esse problema como um jogo de formato amplo, com informações incompletas e um conjunto de ações infinitas .
Pergunta : Presumo que jogos desse tipo não sejam eficientemente computáveis. No entanto, existe um algoritmo de tempo polinomial para maximizar aproximadamente minha recompensa? Que tal um PTAS?
Ou, alternativamente, existe um modelo teórico de jogo mais preciso para esse problema? Nesse caso, a mesma pergunta se aplica: Posso (aproximadamente) maximizar meu pagamento com eficiência? Se sim, como?