O valor esperado da variável aleatória nos lançamentos de uma moeda


8

Me deparei com um problema interessante hoje. Você recebe uma moeda e x dinheiro, você dobra o dinheiro se tiver cara e perder a metade se coroa em qualquer sorteio.

  1. Qual é o valor esperado do seu dinheiro em n tentativas
  2. Qual é a probabilidade de obter mais do que o valor esperado em (1)

Foi assim que me aproximei. A probabilidade de cara e coroa é a mesma (1/2). Valor esperado após o primeiro sorteio = Portanto, o valor esperado é após o primeiro sorteio. Da mesma forma, repetindo a expectativa do segundo sorteio em 5x / 4, Valor esperado após o segundo sorteio =1/2(2x)+1/2(1/2x)=5x/45x/41/2(25x/4)+1/2(1/25x/4)=25x/16

Então você obtém uma sequência de valores esperados: , , , ...25 x / 16 125 x / 645x/425x/16125x/64

Após tentativas, seu valor esperado deve ser .( 5 n / 4 n ) xn(5n/4n)x

Se for grande o suficiente, seu valor esperado deve se aproximar da média da distribuição. Portanto, a probabilidade de que o valor seja maior que o valor esperado deve ser . Eu não tenho certeza sobre este.0,5n0.5


1
A probabilidade de observar o valor acima da mediana é metade, mas sua quantidade é log-normalmente distribuída para n grande, que tem média e mediana diferentes; portanto, você não deve esperar que essa probabilidade se aproxime de 1/2.
Yaroslav Bulatov

Respostas:


9

Se n for grande o suficiente, seu valor esperado deve se aproximar da média da distribuição.

Sim esta correto.

Portanto, a probabilidade de que o valor seja maior que o valor esperado deve ser 0,5.

Isso só seria correto se a distribuição for simétrica - o que no seu jogo não é o caso. Você pode ver isso facilmente se pensar sobre qual deve ser o valor médio dos seus ganhos após jogadas.n


Você pode pensar no seu problema como uma caminhada aleatória . Uma caminhada aleatória unidimensional básica é uma caminhada na linha real inteira, onde em cada ponto movemos com probabilidade . É exatamente isso que você tem se ignorarmos a duplicação / metade do dinheiro e definirmos . Tudo o que precisamos fazer é remapear seu sistema de coordenadas para este exemplo. Seja seu pote inicial. Em seguida, remapeamos da seguinte maneira:p p = 0,5 x±1pp=0.5x

x*2^{-2} = -2
x*2^{-1} = -1 
  x = 0
 x*2 = 1  

ie . Deixe denotar quanto dinheiro ganhamos com o jogo após turnos;S n n2kx=kSnn

Pr(Sn=2kx)=2n(n(n+k)/2)
para .n(n+k)/20

Quando não é múltiplo de 2, . Para entender isso, suponha que começamos com 10 libras. Após turnos, os únicos valores possíveis são £ 5 ou £ 20, ou seja, ou .(n+k)Pr(Sn)=0n=1k=1k=1

O resultado acima é um resultado padrão dos passeios aleatórios. Passeios aleatórios do Google para mais informações. Também a partir da teoria da caminhada aleatória, podemos calcular o retorno médio para , que não é o mesmo que o valor esperado.x

Nota: Presumi que você sempre pode metade do seu dinheiro. Por exemplo, 1 pence, 0,5 pence, 0,25 pence são permitidos. Se você remover essa suposição, terá uma caminhada aleatória com uma parede absorvente.


Para completar

Aqui está uma simulação rápida no R do seu processo:

#Simulate 10 throws with a starting amount of x=money=10
#n=10
simulate = function(){
  #money won/lost in a single game
  money = 10
  for(i in 1:10){
    if(runif(1) < 0.5)
      money = money/2
    else
      money = 2*money
  }
  return(money)
}

#The Money vector keeps track of all the games
#N is the number of games we play
N = 1000
Money = numeric(N)
for(i in 1:N)
  Money[i]= simulate()

mean(Money);median(Money)
#Probabilities
#Simulated
table(Money)/1000
#Exact
2^{-10}*choose(10,10/2)

#Plot the simulations
plot(Money)

Como (n + k) / 2 não é necessariamente integral, considere reescrever a probabilidade como Pr (S_n = 2 ^ {2k-n}) = 2 ^ -n Comb (n, k), 0 <= k <= n. (Há também algo suspeito em você equacionar 2 ^ kx = k.)
whuber

sua variável deve moneyser x?
precisa saber é o seguinte

Jeremy @: Sim, eu mudei. @ whuber: Você está correto, tentei tornar a probabilidade um pouco mais clara. BTW, integral-> inteiro no seu comentário.
csgillespie

1

Seja a riqueza após jogadas deste jogo, onde assumimos A tentação aqui é pegar e estudar como uma caminhada aleatória simétrica, com inovações de tamanho . Acontece que isso será bom para a segunda pergunta, mas não para a primeira. Um pouco de trabalho mostrará que, assintoticamente, temos . Com isso, você não pode concluir que é log assintoticamente normalmente distribuído comSkkS0=1.Xk=logSkXk±log2XkN(0,k(log2)2)Skμ=0,σ=log2k.A operação de log não é comutada com o limite. Se isso acontecesse, você obteria o valor esperado de como , o que está quase correto, mas não completamente.Skexp(klog2log2/2)

Entretanto, esse método é adequado para encontrar quantis de e outras questões de probabilidade, como a pergunta (2). TemosA quantidade no lado esquerdo da última desigualdade é, assintoticamente, um padrão normal e, portanto, a probabilidade de que exceda sua média se aproxima de que é o CDF do padrão normal. Isso se aproxima de zero rapidamente.SkSk(54)kXkklog(5/4)Xk/klog2klog(5/4)/log2.Sk1Φ(klog(5/4)/log2),Φ

Código Matlab para verificar isso:

top_k = 512;
nsamps = 8192;
innovs = log(2) * cumsum(sign(randn(top_k,nsamps)),1);
s_k = exp(innovs);
k_vals = (1:top_k)';
mean_v = (5/4) .^ k_vals;
exceed = bsxfun(@ge,s_k,mean_v);
prob_g = mean(double(exceed),2);

%theoretical value
%(can you believe matlab doesn't come with normal cdf function!?)
nrmcdf = @(x)((1 + erf(x / sqrt(2)))/2);
p_thry = 1 - nrmcdf(sqrt(k_vals) * log(5/4) / log(2));

loglog(k_vals,prob_g,'b-',k_vals,p_thry,'r-');
legend('empirical probability','theoretical probability');

o gráfico produzido: texto alternativo


-1

Você está certo sobre a expectativa.

Na verdade, você também tem a resposta certa para a probabilidade de recuperar mais do que sua aposta original, embora não seja a prova certa. Considere, em vez da quantidade bruta de dinheiro que você tem, seu logaritmo de base 2. Esse é o número de vezes que você duplicou o seu dinheiro, menos o número de vezes que o reduziu pela metade. Esta é a soma de variáveis ​​aleatórias independentes, cada uma igual a ou com probabilidade . A probabilidade que você deseja é a probabilidade de que isso seja positivo. Se é ímpar, então por simetria é exatamente ; se é par (chame-o de ), então éSnn+111/2n1/2n2k1/2menos metade da probabilidade de . Mas , que se aproxima de como .Sn=0P(S2k=0)=(2kk)/22k0k


Essa demonstração parece assumir que a quantia esperada é zero, mas não é. Além disso, você parece presumir que a rede de duplicação menos a metade deve ser não-negativa, o que também está incorreto. Coletivamente, esses erros geram o limite correto, mas isso é um acidente.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.