Existem duas tentativas de fazer exatamente o que você disse na história estatística, o Bayesiano e o Fiducial. RA Fisher fundou duas escolas de pensamento estatístico, a escola Likelihoodist, construída em torno do método da máxima verossimilhança, e a Fiducial, que terminou em fracasso, mas que tenta fazer exatamente o que você deseja.
A resposta curta de por que fracassou é que suas distribuições de probabilidade não acabaram se integrando à unidade. A lição, no final, foi que a probabilidade anterior é uma coisa necessária para criar o que você está tentando criar. Na verdade, você está seguindo o caminho de um dos maiores estatísticos da história e mais do que alguns dos outros grandes nomes morreram na esperança de resolver o problema. Se fosse encontrado, colocaria os métodos de hipótese nula em pé de igualdade com os métodos bayesianos em termos dos tipos de problemas que eles poderiam resolver. De fato, passaria por Bayes, exceto onde existissem informações prévias reais.
Você também deseja ter cuidado com sua afirmação de que um valor p indica uma probabilidade mais alta para a alternativa. Isso é verdade apenas na escola Fisherian Likelihoodist. Não é de todo verdade na escola Frequentist Pearson-Neyman. Sua aposta na parte inferior parece ser uma aposta de Pearson-Neyman, enquanto seu valor-p é incompatível, pois é proveniente da escola dos Pescadores.
Para ser caridoso, assumirei que, para o seu exemplo, não há viés de publicação e, portanto, apenas resultados significativos aparecem em periódicos, criando uma alta taxa de descoberta falsa. Estou tratando isso como uma amostra aleatória de todos os estudos realizados, independentemente dos resultados. Eu argumentaria que suas chances de aposta não seriam coerentes no sentido clássico de Finetti da palavra.
No mundo de Finetti, uma aposta é coerente se o apostador não puder ser apostado pelos jogadores para que eles enfrentem uma perda certa. Na construção mais simples, é como a solução para o problema de cortar o bolo. Uma pessoa corta a peça ao meio, mas a outra pessoa escolhe a peça que deseja. Nesta construção, uma pessoa indicaria os preços das apostas em cada hipótese, mas a outra pessoa escolheria comprar ou vender a aposta. Em essência, você pode vender a descoberto a curto prazo. Para ser ideal, as chances teriam que ser estritamente justas. Valores-p não levam a chances justas.
Para ilustrar isso, considere o estudo de Wetzels, et al. Em http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
A citação para a qual é: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson e Eric-Jan Wagenmakers. Evidência estatística em psicologia experimental: uma comparação empírica usando testes de 855 t. Perspectivas em Ciência Psicológica. 6 (3) 291-298. 2011
Esta é uma comparação direta de 855 testes t publicados usando fatores de Bayes para contornar o problema da distribuição anterior. Em 70% dos valores de p entre 0,05 e 0,01, os fatores de Bayes foram, na melhor das hipóteses, anedóticos. Isso se deve à forma matemática usada pelos freqüentistas para resolver o problema.
Os métodos de hipótese nula presumem que o modelo é verdadeiro e, por sua construção, usam uma distribuição estatística minimax ao invés de uma distribuição de probabilidade. Esses dois fatores afetam as diferenças entre soluções bayesianas e não bayesianas. Considere um estudo em que o método bayesiano avalia a probabilidade posterior de uma hipótese em três por cento. Imagine que o valor-p seja menor que cinco por cento. Ambos são verdadeiros, pois três por cento é inferior a cinco por cento. No entanto, o valor-p não é uma probabilidade. Ele afirma apenas o valor máximo que poderia ser a probabilidade de visualizar os dados, e não a probabilidade real de uma hipótese ser verdadeira ou falsa. De fato, na construção do valor-p, você não pode distinguir entre efeitos devido ao acaso com um nulo verdadeiro e um nulo falso com bons dados.
Se você olhar para o estudo de Wetzel, notará que é muito óbvio que as probabilidades implícitas nos valores-p não coincidem com as probabilidades implícitas na medida bayesiana. Como a medida bayesiana é admissível e coerente, e a não bayesiana não é coerente, não é seguro assumir o mapa dos valores-p para as verdadeiras probabilidades. A suposição forçada de que o nulo é válido fornece boas probabilidades de cobertura, mas não produz boas probabilidades de jogo.
Para entender melhor o porquê, considere o primeiro axioma de Cox de que a plausibilidade de uma hipótese pode ser descrita por um número real. Implicitamente, isso significa que todas as hipóteses têm um número real vinculado à sua plausibilidade. Nos métodos de hipótese nula, apenas o nulo tem um número real vinculado à sua plausibilidade. A hipótese alternativa não possui mensuração e certamente não é o complemento da probabilidade de observação dos dados, dado que o nulo é verdadeiro. De fato, se o nulo for verdadeiro, o complemento é falso por suposição, sem levar em consideração os dados.
Se você construiu as probabilidades usando valores-p como base de sua medição, o bayesiano usando medidas bayesianas sempre seria capaz de obter uma vantagem sobre você. Se o bayesiano definir as probabilidades, a teoria da decisão de Pearson e Neyman forneceria uma declaração de aposta ou não, mas eles não seriam capazes de definir o valor da aposta. Como as probabilidades bayesianas eram justas, o ganho esperado com o uso do método de Pearson e Neyman seria zero.
De fato, o estudo de Wetzel é realmente o que você está falando sobre fazer, mas com 145 apostas a menos. Se você observar a tabela três, verá alguns estudos em que o Frequentista rejeita o nulo, mas o Bayesiano descobre que a probabilidade favorece o nulo.