PBE de pegar ou largar

Eu encontrei uma pergunta interessante olhando para o perfeito equilíbrio bayesiano. Não vi uma pergunta em que as crenças não sejam discretas.

Existe um único comprador em potencial de um objeto que tem valor zero para o vendedor. A avaliação deste comprador v é distribuída uniformemente em [0, 1] e é uma informação privada. O vendedor nomeia um preço que o comprador aceita ou rejeita. $p_1$

Se ele aceitar, o objeto é negociado pelo preço acordado e o pagamento do comprador é e o vendedor é . $v − p_1$ $p_1$

Se ele rejeitar, o vendedor fará outra oferta de preço, p2. Se o comprador aceitar isso, seu pagamento será e o vendedor será , onde . $\delta_(v − p_2)$ $\delta p_2$ $\delta = 0.5$

Se ele rejeitar, os dois jogadores receberão zero (não há mais lances).

Encontre um Equilíbrio Bayesiano Perfeito.

Minha abordagem usual é fixar crenças, mas não sei como fazer isso com crenças contínuas. Algum conselho?

game-theory academic-graduate bayesian-game

— Brian
fonte

Desculpe, não consegui pensar em uma maneira fácil de dar conselhos parciais. Este é um bom exercício. Você (ou o criador) se importaria se eu o usasse na aula?

— Giskard

Claro, fique à vontade!

— Brian

Depois de postar uma solução ruim ontem, acredito que consegui uma melhor:

A estratégia do comprador consiste em duas funções que ambas as funções são mapeadas para (onde significa Accept, para rejeitar). A estratégia do vendedor é $(f_1(v,p_1),f_2(v,p_1,p_2))$ $\left\{A,R\right\}$ $A$ $R$ $(p_1,p_2(f_1(v,p_1)))$ $f_2(v,p_1,p_2)$ $A$ $v \geq p_2$ $H$ $p_1$

p_{2}^{*} = \arg max_{p_{2}} p_{2} \cdot P r o b (f_{2} (v, p_{1}, p_{2}) = A | f_{1} (v, p_{1}) = R) .

$p_2^* = \arg\max_{p_2} p_2 \cdot Prob(f_2(v,p_1,p_2) = A | f_1(v,p_1) = R).$

p_{1}

$p_1$

v - p_{1} \geq δ \cdot (v - p_{2}) .

$v - p_1 \geq \delta \cdot (v - p_2).$

v \cdot (1 - δ) \geq p_{1} - δ \cdot p_{2} .

$v \cdot (1 - \delta) \geq p_1 - \delta \cdot p_2.$ O lado esquerdo desta equação está aumentando em ; portanto, os tipos com alta avaliação serão aceitos. Isso significa que no PBE o conjunto é tal que A partir disso, obtemos o ideal fornecido : No PBE é uma função de : então Determinamos todas as estratégias de PBE, mas

v

$v$

H

$H$

H = [0, \bar{v}) .

$H = [0, \bar{v}).$

p_{2}

$p_2$

\bar{v}

$\bar{v}$

p_{2}^{*} = \arg max_{p_{2}} p_{2} \cdot P r o b (v \geq p_{2} | v \in [0, \bar{v})) = \frac{\bar{v}}{2} .

$p_2^* = \arg\max_{p_2} p_2 \cdot Prob(v \geq p_2 | v \in [0, \bar{v})) = \frac{\bar{v}}{2}.$

\bar{v}

$\bar{v}$

p_{1}

$p_1$

\bar{v} \cdot (1 - δ) = p_{1} - δ \cdot \frac{\bar{v}}{2},

$\bar{v} \cdot (1 - \delta) = p_1 - \delta \cdot \frac{\bar{v}}{2},$

\bar{v} = \frac{p_{1}}{1 - \frac{δ}{2}} .

$\bar{v} = \frac{p_1}{1 - \frac{\delta}{2}}.$

p_{1}

$p_1$ . A recompensa esperada do vendedor é onde Substituindo isso, obtemos

p_{1} \cdot (1 - \frac{p_{1} - δ \cdot p_{2} (\bar{v} (p_{1}))}{1 - δ}) + \frac{1}{2} \cdot p_{2} (\bar{v} (p_{1})) \cdot (\frac{p_{1} - δ \cdot p_{2} (\bar{v} (p_{1}))}{1 - δ} - p_{2} (\bar{v} (p_{1}))),

$p_1 \cdot \left( 1 - \frac{p_1 - \delta \cdot p_2(\bar{v}(p_1))}{1 - \delta} \right) + \frac{1}{2} \cdot p_2(\bar{v}(p_1)) \cdot \left( \frac{p_1 - \delta \cdot p_2(\bar{v}(p_1))}{1 - \delta} - p_2(\bar{v}(p_1)) \right),$

p_{2} (\bar{v} (p_{1})) = \frac{\bar{v} (p_{1})}{2} = \frac{\frac{p_{1}}{1 - \frac{δ}{2}}}{2} = \frac{p_{1}}{2 - δ} .

$p_2(\bar{v}(p_1)) = \frac{\bar{v}(p_1)}{2} = \frac{\frac{p_1}{1 - \frac{\delta}{2}}}{2} = \frac{p_1}{2 - \delta}.$

p_{1} \cdot (1 - \frac{p_{1} - δ \cdot \frac{p_{1}}{2 - δ}}{1 - δ}) + \frac{1}{2} \cdot \frac{p_{1}}{2 - δ} \cdot (\frac{p_{1} - δ \cdot \frac{p_{1}}{2 - δ}}{1 - δ} - \frac{p_{1}}{2 - δ}),

$p_1 \cdot \left( 1 - \frac{p_1 - \delta \cdot \frac{p_1}{2 - \delta}}{1 - \delta} \right) + \frac{1}{2} \cdot \frac{p_1}{2 - \delta} \cdot \left( \frac{p_1 - \delta \cdot \frac{p_1}{2 - \delta}}{1 - \delta} - \frac{p_1}{2 - \delta} \right),$

Você precisa maximizar esse erro . Com , obtive $p_1$ $\delta = 0.5$

p_{1}^{*} = \frac{9}{20}, \bar{v} = \frac{3}{5}, p_{2}^{*} = \frac{3}{10} .

$p_1^* = \frac{9}{20}, \hskip 20pt \bar{v} = \frac{3}{5}, \hskip 20pt p_2^* = \frac{3}{10}.$

— Giskard
fonte

Acho que essa pergunta também pode ser interpretada como uma empresa que tenta rastrear consumidores de diferentes avaliações representadas como o intervalo de unidades fechadas. O esquema de precificação ideal é estabelecer dois preços para que os clientes de altas avaliações paguem a um preço mais alto no primeiro estágio, e alguns daqueles de baixa avaliação paguem a um preço mais baixo no segundo estágio.

— Metta World Peace

Você precisa explicar por que os utilitários são diferentes na segunda rodada. Para o vendedor, pode ser um desconto simples, mas para o comprador? Se o bem fosse durável, os tipos que compram o bem receberiam alguns benefícios nas duas rodadas.

— Giskard

Eu não entendo direito. Por que os compradores não podem descontar o utilitário derivado no segundo turno? Isso pode ser interpretado como uma redução de preço de dois períodos, certo?

— Metta World Peace

Embaraçoso, mas nunca ouvi falar desse modelo até agora. Você está correto, isso descreve bem o jogo acima.

— Giskard

p_{1}

$p_1$

v - p_{1} \geq δ (v - p_{2})

$v-p_1\ge \delta(v-p_2)$

p_{1}

$p_1$

p_{2}

$p_2$

v

$v$