Envelope Paradox

Existem dois envelopes. Um contém $x$ dinheiro e o outro contém $2x$ quantidade de dinheiro. A quantidade exata " $x$ " é desconhecida para mim, mas eu sei o que foi dito acima. Pego um envelope e o abro. Eu vejo $y$ dinheiro nele, obviamente onde $y \in \{x, 2x\}$ .

Agora me oferecem a manutenção ou troca de envelopes.

O valor esperado da troca é . O valor esperado de manter meu envelope é. $(\frac{1}{2} \cdot 2y + \frac{1}{2} \cdot \frac{1}{2}y) = \frac{5}{4}y$ $y$

Parece que eu sempre deveria trocar de envelopes. Minhas duas perguntas:

Esse raciocínio está correto?

É diferente se eu não estou autorizado a abrir o envelope e ver a quantidade de dinheiro, e então eu sou dado a opção de alternar indefinidamente? $y$

microeconomics expected-utility

— Cavalaria Kitsune
fonte

Relacionado: en.wikipedia.org/wiki/Two_envelopes_problem

— Herr K.

Você não pode apenas assumir a expectativa; deve começar com crenças sobre x e atualizá-las de acordo com a regra de Bayes. Depois de ver y, suas crenças sobre qual envelope você abriu terão mudado.

— HRSE

Digamos que x seja distribuído uniformemente entre 0 e

. Então o que?

\infty

$\infty$

— Kitsune Cavalry

@KitsuneCavalry Não existe tal distribuição. (Por favor, envie-me um programa que gere essa distribuição.) De fato, não há resolução que gere as piores crenças dadas na sua pergunta para todos os valores de

. No link de Herr K., isso é explicado em en.wikipedia.org/wiki/…

y

$y$

— Giskard 8/16

@Kitsune Cavalry A distribuição uniforme ao longo da meia linha (ou de toda a linha) é um antes impróprio bem conhecido nas estatísticas bayesianas, veja o exemplo stats.stackexchange.com/a/97790/28746 ou stats.stackexchange.com/a/ 35794/28746

— Alecos Papadopoulos

Respostas:

Aqui está uma abordagem de "maximização da utilidade esperada / teoria dos jogos" (com uma pitada de probabilidade da teoria dos conjuntos). Nesse quadro, as respostas parecem claras.

PREMISAS

Dizem-nos com absoluta honestidade que, para um valor monetário estritamente positivo, os dois bilhetes a seguir foram colocados em uma caixa: com o número de identificação atribuído e com o número de identificação atribuído . Em seguida, foi realizado um sorteio de uma variável aleatória Bernoulli e, com base no resultado e no evento que ocorreu, os valores e $x$ $\{A=x, B= 2x\}$ $1$ $\{A=2x, B= x\}$ $0$ $(p=0.5)$ $x$ foram colocados em envelopes e . Não nos dizem qual é o valor de ou qual foi o valor para qual envelope. $2x$ $A$ $B$ $x$

Primeiro CASO: Escolha um envelope com a opção de alternar sem abri-lo

A primeira questão é como escolhemos um envelope ? Isso tem a ver com preferências. Portanto, assuma que somos maximizadores de utilidade esperados, com a função de utilidade . $u()$

Podemos modelar a estrutura probabilística aqui considerando duas variáveis aleatórias dicotômicas, e representando os envelopes, e a quantidade neles. O suporte de cada um é . Mas eles não são independentes. Então, temos que começar com a distribuição conjunta. Em forma de tabela, a distribuição conjunta e as distribuições marginais correspondentes são $A$ $B$ $\{x, 2x\}$

\begin{array}{rr} A / B \to & x & 2 x & Marg A \\ x & 0 & 0.5 & 0.5 \\ 2 x & 0.5 & 0 & 0.5 \\ Marg B & 0.5 & 0.5 & 1.00 \end{array}

$\begin{array}{| r | r | } \hline \text{A} \;/ \;\;\text{B} \rightarrow & x & 2x & \text {Marg A} \\ \hline \hline x & 0 & 0.5 & 0.5\\ \hline 2x & 0.5 & 0 & 0.5 \\ \hline \text{Marg B} & 0.5 & 0.5 & 1.00 \\ \hline \end{array}$

Isso nos diz que e têm distribuições marginais idênticas. $A$ $B$

Mas isso significa que não importa como escolhemos envelopes, porque sempre obteremos o mesmo utilitário esperado ,

0.5 \cdot u (x) + 0.5 \cdot u (2 x)

$0.5 \cdot u(x) + 0.5\cdot u(2x)$

O que estamos enfrentando aqui é uma aposta composta (como escolher um envelope) sobre duas apostas idênticas (cada envelope). Podemos escolher com probabilidade , ou qualquer coisa intermediária (e complementarmente para ). Não importa. Sempre teremos o mesmo utilitário esperado. Observe que nossa atitude em relação ao risco não desempenha um papel aqui. $A$ $1$ $0$ $B$

Então escolhemos um envelope, digamos , e estamos olhando para ele. Qual é agora a nossa utilidade esperada? Exatamente o mesmo que antes da escolha . Escolher um envelope de qualquer maneira não afeta as probabilidades do que está dentro. $A$

$B$

$A$ $B$

Então, aqui, somos indiferentes à mudança. e, de fato, também poderíamos aleatoriamente.

2º CASO: ABRIR O ENVELOPE com a opção de alternar após

$A$ $y \in \{x, 2x\}$

Vamos ver. Eu me pergunto o que é

P (A = x ∣ A \in {x, 2 x}) = ?

$P(A = x \mid A \in \{x, 2x\}) = ?$

$\{x, 2x\}$ $A$ $A$

Mas também me pergunto, o que é

P (B = x ∣ A \in {x, 2 x}) = ?

$P(B = x \mid A \in \{x, 2x\}) = ?$

$\big \{A \in \{x, 2x\}\big\}$ $(A,B)$ $B$ $B$

$u(y)$

y = x, u (A) = u (x) ⟹ u (B) = u (2 x)

$y = x, u(A) = u(x) \implies u(B) = u(2x)$

y = 2 x, u (A) = u (2 x) ⟹ u (B) = u (x)

$y = 2x, u(A) = u(2x)\implies u(B) = u(x)$

$p=0.5$

$p=0.5$ $y=x$ $p=0.5$ $y=2x$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 x) & u (x) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2x) & u(x) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

$u(x)$ $u(2x)$ $u(y)$ $u(y)$ $x$ $y=x$ $u(2x) = u(2y)$ $y=2x$ $u(x) = u(y/2)$

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 y) & u (y / 2) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2y) & u(y/2) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Agora todos os payoffs na matriz são conhecidos. Existe uma estratégia dominante pura?

O retorno esperado da estratégia "Switch" é

E (V_{S}) = 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2)

$E(V_S) = 0.5\cdot u(2y) + 0.5 \cdot u(y/2)$

O retorno esperado da estratégia "Não mude" é

E (V_{D S}) = u (y)

$E(V_{DS}) = u(y)$

Devemos mudar se

E (V_{S}) > E (V_{D S}) ⟹ 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2) > u (y)

$E(V_S) > E(V_{DS}) \implies 0.5\cdot u(2y) + 0.5 \cdot u(y/2) > u(y)$

E agora , a atitude em relação ao risco se torna crítica. Não é difícil deduzir que, sob comportamentos de risco e neutro, devemos mudar.

No que diz respeito ao comportamento avesso ao risco , encontro um resultado elegante:

Para funções utilitárias "menos côncavas" (estritamente acima) do que logarítmicas (por exemplo, raiz quadrada), ainda devemos alternar.

$u(y) = \ln y$

Por "mais côncava" do que (estritamente abaixo) funções de utilidade logarítmica, devemos não interruptor.

Fecho com o diagrama do caso logarítmico

$y=4$ $y/2 =2, 2y = 8$ $Γ-Δ-Ε$ $50-50$ $\Delta$ $Γ-Δ-Ε$ $\ln(4)$

— Alecos Papadopoulos
fonte

u (2 y)

$u(2y)$

u (y / 2

$u(y/2$

x

$x$

x > 0

$x>0$

x

$x$

x

$x$

y

$y$

y

$y$ é suficientemente grande. Veja jstor.org/stable/2685310 .

— Jarle Tufto 15/01

p = 0.5

$p=0.5$

X

$X$

2 X

$2X$

X

$X$

π (x) = 1

$\pi(x) =1$

x > 0

$x>0$

P (X = y | Y = y) = P (X = y / 2 | Y = y) = 1 / 2

$P(X=y|Y=y) = P(X=y/2|Y=y)=1/2$

y

$y$

π (x)

$\pi(x)$

y

$y$

@JarleTufto Este impróprio antes de você mencionar, reflete probabilidades relacionadas a quê?

— Alecos Papadopoulos

X

$X$

2 X

$2X$

X

$X$

Se você abrir o envelope E1 e verificar que seu valor é E1 = Y , é verdade que o valor do outro envelope E2 está em {E2 = Y / 2, E2 = 2Y} .

Também é verdade que o valor esperado desse envelope é (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

O erro está assumindo que Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2, independentemente do que Y é. Uma maneira simplista de mostrar isso é assumir que cada envelope contém papel-moeda dos EUA de várias denominações. Se Y = $ 1 , é impossível para E2 ser Y / 2 .

Uma prova mais rigorosa é muito detalhada para fornecer aqui, mas um resumo disso é primeiro supor que, para qualquer valor Z , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Essa é essencialmente a mesma suposição que no último parágrafo, expandida para uma faixa de valores. Mas se isso é verdade para qualquer valor de Z , significa que Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) é constante para todo valor de N , de -inf a inf. Como isso é impossível, a suposição não pode estar correta.

+++++

Isso pode ter sido um pouco confuso, então deixe-me tentar um exemplo. Você recebe dois conjuntos de dois envelopes. Em um conjunto, eles contêm 10 e 20 dólares. No outro, eles contêm 20 e 40. Você escolhe um conjunto e, em seguida, abre um envelope nesse conjunto para encontrar 20. Você tem a chance de mudar para o outro envelope desse conjunto. Você deveria?

Sim, deve mudar. O ganho esperado ao mudar para o outro envelope é [(20-10) + (20-40)] / 2 = +5.

Observe que essa instância - ou seja, sabendo que você encontrou 20, e não 10 ou 40, se encaixa nas condições descritas em sua pergunta. Portanto, sua solução funciona. Mas o experimento em si não se encaixa nessa descrição. Se você encontrou 10 ou 40, a probabilidade de outro envelope ter 20 é 100%. Os ganhos esperados são +10 e -20, respectivamente. E se você calcular a média dos três ganhos possíveis em relação às probabilidades, obteria os três valores, obterá 10/4 + 5/2 - 20/4 = 0.

— JeffJo
fonte

Por que eu assumiria que um envelope não poderia ter 50 centavos? Além disso, a pergunta é especificamente sobre horários em que você não sabe os possíveis valores que poderiam estar nele, apenas os possíveis valores relativos, por isso não estou realmente seguindo isso.

— Kitsune Cavalry

2 | E 1 =

$2|E1=$

Geralmente, o problema é insolúvel, porque você não especificou o procedimento de randomização de toda a experiência.

$E[X|Y=y]$ $\mathbb{R}$ $Pr(Y=y)=0$

— John Rambo
fonte

@JeffJo, não pude comentar em sua postagem por não ter reputação suficiente. Adicionei esta resposta porque acredito que esteja relacionada à sua postagem.

— John Rambo