Fiz essa pergunta com em uma entrevista. Existe uma resposta "correta"?
Suponha que os lançamentos sejam iid e a probabilidade de cabeças é . A distribuição do número de cabeças em 400 lançamentos deve ser próxima de Normal (200, 10 ^ 2), de modo que 220 cabeças estejam a 2 desvios padrão da média. A probabilidade de observar tal resultado (ou seja, mais 2 DPs da média em qualquer direção) é um pouco menor que 5%.
O entrevistador me disse, essencialmente, "se eu observar algo> = 2 DPs da média, concluo que algo mais está acontecendo. Aposto que a moeda é justa". Isso é razoável - afinal, é o que a maioria dos testes de hipóteses faz. Mas esse é o fim da história? Para o entrevistador, essa parecia ser a resposta "correta". O que estou perguntando aqui é se alguma nuance é justificada.
Não pude deixar de salientar que decidir que a moeda não é justa é uma conclusão bizarra neste contexto de lançamento de moedas. Estou certo em dizer isso? Vou tentar explicar abaixo.
Primeiro de tudo, eu - e eu suponho que a maioria das pessoas também - tenha um forte prévio sobre moedas: é muito provável que sejam justas. É claro que isso depende do que entendemos por justo - uma possibilidade seria definir "justo" como "ter uma probabilidade de cabeças 'próximas' de 0,5, digamos entre 0,49 e 0,51".
(Você também pode definir 'justo' no sentido de que a probabilidade de cabeças é exatamente 0,50, caso em que ter uma moeda perfeitamente justo agora parece bastante un provável.)
Seu prior pode depender não apenas de suas crenças gerais sobre moedas, mas também do contexto. Se você puxou a moeda do seu próprio bolso, pode estar virtualmente certo de que é justo; se o seu amigo mágico o tirou do seu, o seu prior pode dar mais peso às moedas de duas cabeças.
De qualquer forma, é fácil criar antecedentes razoáveis que (i) coloquem uma grande probabilidade de que a moeda seja justa e (ii) levem a sua posterior a ser bastante semelhante, mesmo depois de observar 220 cabeças. Você concluiria que a moeda provavelmente seria justa, apesar de observar um resultado de 2 DPs a partir da média.
De fato, você também pode construir exemplos em que observar 220 cabeças em 400 lançamentos faz com que o seu posterior ponha mais peso na moeda, sendo justo, por exemplo, se todas as moedas injustas tiverem probabilidade de cara em .
Alguém pode lançar alguma luz sobre isso para mim?
Depois de escrever essa pergunta, lembrei-me de que já ouvira falar dessa situação geral antes - não é o "paradoxo" de Lindley ?
Whuber colocou um link muito interessante nos comentários: Você pode carregar um dado, mas não pode influenciar uma moeda . Da página 3:
Não faz sentido dizer que a moeda tem uma probabilidade p de cabeças, porque pode ser completamente determinada pela maneira como é lançada - a menos que seja lançada alta no ar com um giro rápido e apanhada no ar com sem saltar, caso em que p = 1/2.
Muito legal! Isso se encaixa na minha pergunta de uma maneira interessante: suponha que sabemos que a moeda está sendo "lançada no ar com um giro rápido e capturada no ar sem pular". Definitivamente, não devemos rejeitar a hipótese de que a moeda é justa (onde "justo" agora significa "ter p = 1/2 quando jogado da maneira descrita acima"), porque temos efetivamente um prior que coloca toda a probabilidade no moeda sendo justa. Talvez isso justifique, até certo ponto, por que estou desconfortável em rejeitar o nulo depois que 220 cabeças são observadas.