Em suma, o argumento de Birnbaum é que dois princípios amplamente aceitos implicam logicamente que o princípio da probabilidade deve se manter. O contra-argumento de Mayo é que a prova está errada porque Birnbaum usa mal um dos princípios.
Abaixo, simplifico os argumentos na medida em que eles não são muito rigorosos. Meu objetivo é torná-los acessíveis a um público mais amplo, porque os argumentos originais são muito técnicos. Os leitores interessados devem ver os detalhes nos artigos vinculados na pergunta e nos comentários.
Por uma questão de concretude, vou me concentrar no caso de uma moeda com viés desconhecido . No experimento , 10 vezes. No experimento , até obter 3 "caudas". No experimento , jogamos uma moeda justa chamada "1" e "2": se ela obtiver um "1", executaremos ; se obtiver um "2", executaremos . Este exemplo simplificará bastante a discussão e exibirá a lógica dos argumentos (as provas originais são obviamente mais gerais).θE1E2EmixE1E2
Os princípios:
Os dois princípios a seguir são amplamente aceitos:
O Princípio da Condicionalidade Fraca diz que devemos tirar as mesmas conclusões se decidirmos realizar o experimento , ou se decidirmos executar e a moeda cair "1".E1Emix
O Princípio da Suficiência diz que devemos tirar as mesmas conclusões em dois experimentos em que uma estatística suficiente tem o mesmo valor.
O princípio a seguir é aceito pelos bayesianos, mas não pelos freqüentadores. No entanto, Birnbaum afirma que é uma consequência lógica dos dois primeiros.
O Princípio da Verossimilhança diz que devemos tirar as mesmas conclusões em dois experimentos em que as funções de verossimilhança são proporcionais.
Teorema de Birnbaum:
Digamos que realizamos e obtemos 7 "cabeças" em cada dez movimentos. A função de probabilidade de é . Realizamos e virar a moeda 10 vezes para obter 3 "caudas". A função de probabilidade de é . As duas funções de probabilidade são proporcionais.E1θ(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum considera a seguinte estatística em de a :
onde e são os números de "cara" e "coroa", respectivamente. Portanto, aconteça o que acontecer, relata o resultado como se tivesse vindo do experimento . Acontece que é suficiente para em . O único caso não trivial é quando e , onde temosEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Todos os outros casos são 0 ou 1 - exceto , que é o complemento da probabilidade acima. A distribuição de dada é independente de , então é uma estatística suficiente para .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Agora, de acordo com o princípio da suficiência, devemos concluir o mesmo para e em e, a partir do princípio da condicionalidade fraca, devemos concluir o mesmo para em e em , bem como para em e em . Portanto, nossa conclusão deve ser a mesma em todos os casos, que é o princípio da probabilidade.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Contra-prova da Mayo:
A configuração de Birnbaum não é um experimento de mistura porque o resultado da moeda rotulada "1" e "2" não foi observado , portanto, o princípio da condicionalidade fraca não se aplica a este caso .
Faça o teste versus e tire uma conclusão do valor-p do teste. Como observação preliminar, observe que o valor p de em é dado pela distribuição binomial como aproximadamente ; o valor p de em é dado pela distribuição binomial negativa como aproximadamente .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Aí vem a parte importante: o valor p de em é dado como a média das duas - lembre-se de que não sabemos o status da moeda - ou seja, aproximadamente . No entanto, o valor p de em - onde a moeda é observada - é o mesmo de , ou seja , aproximadamente . O princípio da condicionalidade fraca é válido (a conclusão é a mesma em e em onde a moeda cai "1") e, no entanto, o princípio da probabilidade não. O contra-exemplo refuta o teorema de Birnbaum.T=(1,7,3)Emix0.1309(1,7,3)EmixE10.1719E1Emix
Refutação de Peña e Berger da contra-prova de Mayo:
Mayo mudou implicitamente a afirmação do princípio da suficiência: ela interpreta "mesmas conclusões" como "mesmo método". Tomar o valor-p é um método de inferência, mas não uma conclusão.
O princípio suficiência diz que se existe uma estatística suficiente, então as conclusões deve ser o mesmo, mas não requer a estatística suficiente para ser usado em tudo. Se isso acontecesse, levaria a uma contradição, como demonstrado por Mayo.