Para maximizar a chance de adivinhar corretamente o resultado de uma troca de moeda, devo sempre escolher o resultado mais provável?


20

Isso não é lição de casa. Estou interessado em entender se minha lógica está correta com esse problema simples de estatísticas.

Digamos que eu tenha uma moeda de 2 faces, onde a probabilidade de virar uma cabeça é e a probabilidade de virar uma cauda é 1 - P ( H ) . Vamos supor que todos os lançamentos tenham probabilidades independentes. Agora, digamos que eu queira maximizar minhas chances de prever se a moeda será uma cabeça ou uma cauda no próximo lançamento. Se P ( H ) = 0,5 , posso adivinhar cara ou coroa aleatoriamente e a probabilidade de eu estar correta é 0,5 .P(H)1P(H)P(H)=0.50.5

Agora, suponha que , se eu quiser maximizar minhas chances de adivinhar corretamente, devo sempre adivinhar caudas onde a probabilidade é de 0,8 ?P(H)=0.20.8

Dando um passo adiante, se eu tivesse um dado de três lados, e a probabilidade de rolar um 1, 2 ou 3 era , P ( 2 ) = 0,5 e P ( 3 ) = 0,4 , devo sempre adivinhar 2 para maximizar minhas chances de adivinhar corretamente? Existe outra abordagem que me permita adivinhar com mais precisão?P(1)=0.1P(2)=0.5P(3)=0.4


4
Parece-me que você está perguntando sobre independência: por exemplo, se você fica bravo uma vez, isso torna as caudas mais prováveis ​​na próxima vez? Se não é isso que você está perguntando, você poderia esclarecer sua pergunta? (Se entendi sua pergunta corretamente, a resposta é 'sim': em situações como o lançamento de moedas, o resultado mais provável será sempre o de maior probabilidade, independentemente do que aconteceu anteriormente.)
arboviral

Obrigado pela ajuda @arboviral. Sim, estou assumindo independência. Atualizei a pergunta para indicar isso.
tartaruga

4
Assumindo independência, a melhor coisa que você pode fazer é escolher o lado com a maior probabilidade. Pense desta maneira. Você não tem outras informações para adivinhar melhor. Tudo o que você sabe sobre os dados é com que frequência um determinado lado aparece e quais foram os últimos lançamentos. Mas a independência diz que as linhas anteriores não têm efeito no lançamento atual. Talvez se você tivesse mais informações, como a quantidade de força usada para jogar dados, mão esquerda / lançador da mão direita ou número de batidos antes do lançamento. No entanto, se o dado for realmente justo, duvido que mesmo esse nível de detalhe forneça melhores previsões.
Brent Ferrier

Seu palpite está correto; é uma conseqüência imediata da desigualdade do titular (com os parâmetros ). (1,)
whuber

Você sabia que P (H) = 0,2? Ou isso é algo que você precisa descobrir observando os resultados?
Akavall 17/05

Respostas:


43

Você está certo. Se , e você está usando a perda zero um (ou seja, você precisa adivinhar um resultado real em oposição a uma probabilidade ou algo assim) e, além disso, ficar bravo ao adivinhar caudas é tão ruim quanto obter coroa quando adivinhou cara), você deve adivinhar coroa sempre.P(H)=0,2

As pessoas muitas vezes pensam erroneamente que a resposta é adivinhar caudas em 80% dos ensaios selecionados aleatoriamente e seguir o restante. Essa estratégia é chamada de " correspondência de probabilidades " e tem sido estudada extensivamente na tomada de decisões comportamentais. Veja, por exemplo,

West, RF; e Stanovich, KE (2003). A correspondência de probabilidades é inteligente? Associações entre escolhas probabilísticas e capacidade cognitiva. Memória e cognição, 31 , 243–251. doi: 10.3758 / BF03194383


1
+1 para o ponteiro para correspondência de probabilidade. Nunca ouvi falar disso antes, mas tenho certeza de que aproveito isso diariamente como um viés cognitivo! :)
leekaiinthesky

2
(+1) Isso se refere a um equívoco comum na interpretação de modelos de regressão multinomial e afins: as pessoas podem se surpreender que a distribuição de classes previstas não corresponda à distribuição das classes observadas e até mesmo procurar maneiras de "corrigi-las". . (É bom saber que ele tem um nome.)
Scortchi - Restabelece Monica

1
(+1) para o termo "correspondência de probabilidade".
Haitao Du

13

Você está essencialmente fazendo uma pergunta muito interessante: devo prever usando a estimativa "MAP Bayesian" máxima a posteriori ou "Real Bayesian".

Suponha que você saiba a verdadeira distribuição que , em seguida, usando a estimativa MAP, suponha que você queira fazer 100 previsões nos próximos 100 resultados invertidos. Você deve sempre adivinhar que o flip é cauda , NÃO adivinhando 20 cabeças e 80 cauda. Isso é chamado "MAP Bayesian", basicamente você está fazendoP(H)=0,22080

argmaxθf(x|θ)

Não é difícil provar que, ao fazer isso, você pode minimizar o erro previsto (perda de 0-1). A prova pode ser encontrada na página 53 da Introdução à aprendizagem estatística .


Existe outra maneira de fazer isso chamada abordagem "Real Bayesiana". Basicamente, você não está tentando "selecionar o resultado com maior probabilidade, mas considere todos os casos de maneira probabilística". Portanto, se alguém lhe pedir para "prever os próximos 100" flips, você deve fazer uma pausa, porque quando você forneceu 100 resultados binários, as informações probabilísticas de cada resultado desaparecem. Em vez disso, você deve perguntar o que deseja fazer depois de conhecer os resultados.

Suponha que ele / ela tenha alguma função de perda (não necessária para perda de 0-1, por exemplo, a função de perda pode ser, se você perder a cabeça, precisará pagar US $ 1, mas se perder a cauda, ​​precisará pagar US $ 5, ou seja, perda desequilibrada) em sua previsão, você deve usar seu conhecimento sobre a distribuição de resultados para minimizar a perda em toda a distribuição

xyp(x,y)eu(f(x),y)

, ou seja, incorpore seu conhecimento sobre a distribuição para perda, em vez de "de maneira inteligente", obtendo as previsões e executando as próximas etapas.

P(S1)=0,1P(S2)=P(S3)=P(S100)=0,9/99=0,009090S190%


4
O MAP também é bayesiano. Além disso, você descreve as duas abordagens sem se referir, de maneira alguma, ao uso de anteriores, o que pode ser enganador, pois você está escrevendo sobre métodos bayesianos e os anteriores são a principal característica desses métodos.
Tim

'Então, se alguém pedir para você "prever os próximos 100" flips, você deve se recusar a fazer isso' ' Se alguém me oferecer um bilhão de euros se eu predizer corretamente, provavelmente não recusaria. Ou provavelmente você quer dizer 'prever' com um significado diferente de 'tentar adivinhar'.
JiK

"quando você fornece 100 resultados binários, as informações probabilísticas de cada resultado desaparecem" No começo, eu li isso como "quando você recebe 100 resultados binários" e não conseguia entender a frase, mas agora percebi que isso pode significar "quando você fornece 100 resultados binários ". Qual deles está correto e, se for o primeiro, o que significa?
Jik

1
Um ponto muito menor: eu provavelmente adicionaria uma linha vertical após o segundo parágrafo para indicar que os dois primeiros parágrafos são tecnicamente suficientes para responder à pergunta literal e o restante são informações adicionais (o que sem dúvida é interessante e útil).
Jik

2
No último parágrafo: "A estimativa do MAP não funcionará bem se o número de resultados for grande. - - No entanto, você errará 90% das vezes !!" Não funcionar bem é sempre uma questão de contexto. Se, por exemplo, este é um jogo de apostas repetidas (o pote é dividido entre as pessoas que acertam corretamente ou retornam se ninguém adivinhar), a estratégia MAP pode ganhar muito dinheiro a longo prazo se você jogar contra pessoas que, por exemplo, empatam suas adivinhações. da distribuição dos resultados.
Jik

4

Devido à independência, seu valor esperado é sempre maximizado se você adivinhar o caso mais provável. Não existe uma estratégia melhor, porque cada flip / roll não fornece informações adicionais sobre a moeda / dado.

Em qualquer lugar que você adivinhe um resultado menos provável, sua expectativa de vitória é menor do que se você tivesse adivinhado o caso mais provável; portanto, é melhor adivinhar o caso mais provável.

Se você quisesse fazer isso de forma que precisasse mudar sua estratégia enquanto jogava, você pode considerar uma moeda / dado em que você não conhece as probabilidades inicialmente e precisa descobri-las enquanto rola.


1
para mim, essa resposta é a explicação mais simples; se você tivesse que definir uma estratégia considerando o resultado obtido anteriormente, isso quebraria as probabilidades "independentes".
Walfrat 18/05
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.