O maior problema que vejo é que não há estatística de teste derivada. valor (com todas as críticas que os estatísticos bayesianos montam contra ele) para um valor de uma estatística de teste é definido como (supondo que o nulo seja rejeitado por valores maiores de , como seria o caso de estatísticas, digamos). Se você precisar tomar uma decisão de maior importância, poderá aumentar o valor crítico e aumentar ainda mais a região de rejeição. Efetivamente, é isso que várias correções de teste como Bonferroni fazem, instruindo você a usar um limite muito mais baixo parat T P r o b [ T ≥ t | H 0 ] T χ 2 p 0 , 1 / 36 , 2 / 36 , ...ptTProb[T≥t|H0]Tχ2p-valores. Em vez disso, o estatístico freqüentista fica preso aqui com os testes de tamanhos na grade de .0,1/36,2/36,…
Evidentemente, essa abordagem "freqüentista" não é científica, pois o resultado dificilmente será reproduzível. Uma vez que a Sun fica supernova, ela permanece supernova, então o detector deve continuar dizendo "Sim" repetidamente. No entanto, é improvável que uma operação repetida desta máquina produza o resultado "Sim" novamente. Isso é reconhecido em áreas que desejam se apresentar como rigorosas e tentar reproduzir seus resultados experimentais ... o que, tanto quanto eu entendo, acontece com probabilidade entre 5% (publicar o artigo original foi um erro puro do tipo I) e algo em torno de 30-40% em alguns campos médicos. O pessoal da meta-análise pode preenchê-lo com números melhores, esse é apenas o burburinho que me ocorre de tempos em tempos através das estatísticas.
Um outro problema da perspectiva freqüentista "adequada" é que rolar um dado é o teste menos poderoso, com poder = nível de significância (se não for menor; 2,7% de potência para o nível de significância de 5% não é nada para se vangloriar). A teoria de Neyman-Pearson para testes t agoniza ao demonstrar que essa é uma UMPT, e muita teoria estatística de alto nível (que eu mal entendo, tenho que admitir) é dedicada a derivar as curvas de poder e encontrar as condições quando um dado teste é o mais poderoso de uma determinada classe. (Créditos: @Dikran Marsupial mencionou a questão do poder em um dos comentários.)
Não sei se isso o incomoda, mas o estatístico bayesiano é mostrado aqui como o cara que não sabe matemática e tem um problema de jogo. Um estatístico bayesiano adequado postularia o anterior, discutira seu grau de objetividade, derivaria o posterior e demonstraria o quanto eles aprenderam com os dados. Nada disso foi feito, de modo que o processo bayesiano foi simplificado demais, tanto quanto o processo freqüentador.
Essa situação demonstra a triagem clássica para a questão do câncer (e tenho certeza de que os bioestatísticos podem descrevê-la melhor do que eu). Ao rastrear uma doença rara com um instrumento imperfeito, a maioria dos positivos passa a ser falso-positivo. Os estatísticos inteligentes sabem disso e sabem melhor para acompanhar peneiradores baratos e sujos com biópsias mais caras e precisas.