Role um dado até que caia em qualquer número que não seja 4. Qual é a probabilidade de o resultado ser> 4?


20

Um jogador recebe um dado justo de seis lados. Para vencer, ela deve rolar um número maior que 4 (ou seja, 5 ou 6). Se ela rola um 4, ela deve rolar novamente. Quais são as chances dela de ganhar?

Eu acho que a probabilidade de ganhar P(W) pode ser expressa recursivamente como:

P(W)=P(r=5r=6)+P(r=4)P(W)

Eu aproximada P(W) como 0.3999 executando 1 milhão de ensaios em Java, como este:

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

E vejo que se poderia expandir assim:P(W)

P(W)=13+16(13+16(13+16))...

Mas não sei como resolver esse tipo de relação de recorrência sem recorrer a esse tipo de aproximação. É possível?


6
É um grande esforço para estabelecer a relação de recorrência. Você tem um bom motivo para acreditar que a resposta é 0,4. Essa é uma forte dica de que há outra maneira de pensar no problema que lhe dá a resposta diretamente. Procure por isso. A resposta da Geomatt o levará até lá, o que, por sua vez, o ajudará a entender o que está acontecendo aqui e até a simplificar outros problemas encontrados mais rapidamente sem esse tipo de esforço. Se um problema aparentemente complicado parecer ter uma resposta simples, você sempre deve investir tempo para tentar descobrir o porquê. Paga enormes dividendos mais tarde.
Joel

8
Depois que você percebe que, devido às probabilidades iguais de todos os seis resultados e à independência dos testes, não há nada de especial em nenhum resultado específico desse experimento, é óbvio que todos os cinco resultados possíveis são igualmente prováveis.
whuber

6
Eu estou um pouco desapontado ninguém pôs-se a absorver Cadeia Markov solução para isso ainda :-) Math Stack Exchange tem uma nobre tradição da "solução exagero" que raramente parece permear a Cruz Validado ...
Silverfish

2
É 2/5 para escolher um dos de { 1 , 2 , 3 , 5 , 6 }, portanto sua simulação provavelmente está correta. {5,6}{1,2,3,5,6}
mathreadler

2
Este post vs as respostas é o que eu imagino que os cientistas de dados sejam contra os estatísticos.
Bdeonovic 29/08/16

Respostas:


47

Apenas resolva usando álgebra:

P(W)=26+16P(W)56P(W)=26P(W)=25.

2
Observe que esse cálculo é válido apenas porque a propriedade Strong Markov é válida para cadeias discretas de Markov.
precisa saber é o seguinte

Não me lembro das minhas cadeias discretas de Markov, mas arriscaria, com base na matemática simples, que você queira dizer que a relação de recorrência é válida apenas por causa da propriedade Strong Markov. Depois que a relação é estabelecida, estamos resolvendo apenas x.
josinalvo

Isso está correto?
josinalvo

1
@josinalvo: Tecnicamente, a questão é se P (W) nos dois lados da equação significa o mesmo. A propriedade Strong Markov implica que sim. Na ausência dessa propriedade, P (W) no lado esquerdo significa "a chance de ganhar com este teste" e 1/6 * P (W) no lado direito significa "a chance de ganhar após o teste de 4".
MSalters

81

Nota: Esta é uma resposta para a pergunta inicial, e não a recorrência.

Se ela fizer um 4, basicamente não conta, porque o próximo lançamento é independente. Em outras palavras, depois de rolar um 4, a situação é a mesma de quando ela começou. Portanto, você pode ignorar o 4. Os resultados que podem ser importantes são 1-3 e 5-6. Existem 5 resultados distintos, 2 dos quais estão vencendo. Portanto, a resposta é 2/5 = 0,4 = 40%.


8
Você pode tornar isso um pouco mais direto: "Considere o primeiro rolo que não é um 4. Em seguida, os resultados ..."
Joel

2
Os olhos da maioria das pessoas rolam quando veem toneladas de matemática, então eu gosto mais dessa. Basicamente, você está removendo 4 dos resultados, então são 1, 2, 3, 5, 6. Torna-se óbvio que você tem 40% de chance nesse ponto.
Nelson

Eu pensei isso no título, então, na maioria das vezes, apenas deslizei a questão completa depois que clicamos nela. Caso contrário, eu provavelmente teria me confundido e adivinhado!
GeoMatt22

1
@ Nelson Eu já vi mais pessoas cujos olhos rolam quando veem esse tipo de raciocínio em um problema de probabilidade do que pessoas cujos olhos rolam quando veem . p=a+bp
Jik

Sim. A moral da história é: não tente tornar um problema mais difícil do que precisa ser.
Jay

14

As respostas de dsaxton ( /stats//a/232107/90759 ) e GeoMatt22 ( /stats//a/232107/90759 ) fornecem as melhores abordagens para o problema. Outra é perceber que sua expressão

P(W)=13+16(13+16())

É realmente uma progressão geométrica :

13+1613+16213+

Em geral, temos

n=0a0qn=a01q

então aqui temos

P(W)=13116=13:56=615=25.

Obviamente, a maneira de provar a fórmula geral da soma de uma progressão geométrica é usando uma solução algébrica similar a dsaxton.


@ William, não acho que o seu comentário seja apropriado por várias razões. 1. Eu nunca disse que você precisa de séries geométricas para isso. 2. Os conceitos que você usa em sua resposta são máquinas muito mais pesadas, é irônico dizer "você não precisa de séries geométricas! Você só precisa da propriedade Markov forte, muito mais avançada e sofisticada". 3. Uma solução simples e rigorosa já foi fornecida pela dsaxton. Seu método é mais indireto e exagerado para esse problema. 4. O OP já tinha uma expressão equivalente a uma série geométrica, alguém tinha que abordar isso, também pode ser eu.
Meni Rosenfeld

1
@ William: Em última análise, sua própria resposta é boa, perspicaz e uma adição útil à coleção de respostas para a pergunta. Isso não significa que você deve procurar todas as outras respostas e dizer que a sua é muito melhor. Eles estão bem também. Nem tudo precisa ser abordado da maneira mais abstrata e geral possível.
Meni Rosenfeld

Já faz um tempo desde que eu era formado em matemática, então peço desculpas se minha resposta não teve rigor. (Só por favor não me diga que ele depende do axioma da escolha , como que seria humilhante!) :)
GeoMatt22

3

Todas as respostas acima estão corretas, mas não explicam por que estão corretas e por que você pode ignorar tantos detalhes e evitar a necessidade de resolver uma complicada relação de recorrência.

A razão pela qual as outras respostas estão corretas é a propriedade Strong Markov , que para uma Cadeia de Markov discreta é equivalente à propriedade regular de Markov. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

Basicamente, a ideia é que a variável aleatória

τ:=(

é um tempo de parada . https://en.wikipedia.org/wiki/Stopping_time Um tempo de parada é uma variável aleatória que não depende de nenhuma informação futura .

nτ=nτ

τXτ

τ1τXτ>4

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

τ=1

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
which of course is the correct answer.

You can read more about stopping times and the Strong Markov property in Section 8.3 of (the 4th edition of) Durrett's Probability Theory and Examples, p. 365.


As far as I can tell from the wiki entry, the existence of a stopping time is necessary but not sufficient to say that a series of events exhibits the SMP. Sorry if I'm missing an in-joke or profound insight, but why not just assume that rolls are independent and get on with it?
Jacob Raihle

@JacobRaihle "Strong Markov property, which for a discrete Markov Chain is equivalent to the regular Markov property." This scenario clearly constitutes a discrete Markov chain. The rolls are independent, that's why it's a discrete Markov chain. The issue is that the event "first roll which does not land on 4" is not independent of the previous rolls, for reasons which are hopefully obvious.
Chill2Macht

It's equally clear that the rolls are independent. So what additional benefit does the SMP provide?
Jacob Raihle

@JacobRaihle Even though the value of the rolls are independent, the value of the die the first time it lands on a value not equal to 4 is NOT independent of the values on which the die landed on previous rolls.
Chill2Macht

It should be, since the rolling stops as soon as that happens. There can be no non-4 roll that isn't also the first one. And even if that were not the case, I'm not sure what kind of relationship you are suggesting.
Jacob Raihle

1

Another way to look at the problem.

Lets call a 'real result' a 1,2,3,5 or 6.

What is the probability of winning on the first roll, if you got a 'real result'? 2/5

What is the probability of winning on the second roll, if the second roll is the first time you got a 'real result'? 2/5

Same for third, fourth.

So, you can break your sample in (infinte) smaller samples, and those samples all give the same probability.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.