Por que os pontos de corte usados para os fatores e valores p de Bayes são tão diferentes?

Estou tentando entender o fator Bayes (BF). Eu acredito que eles são como uma razão de verossimilhança de 2 hipóteses. Portanto, se BF for 5, isso significa que H1 é 5 vezes mais provável que H0. E o valor de 3-10 indica evidência moderada, enquanto> 10 indica evidência forte.

No entanto, para o valor P, tradicionalmente 0,05 é considerado como ponto de corte. Nesse valor de P, a razão de probabilidade H1 / H0 deve ser de cerca de 95/5 ou 19.

Então, por que um valor de corte> 3 é obtido para BF, enquanto um valor de corte> 19 é calculado para valores de P? Esses valores também não estão próximos.

— rnso
fonte

Fico desconfortável ao dizer "se BF for , significa que é vezes mais provável que ". O fator de Bayes, pode ser uma razão de probabilidade marginal, mas ele não é um rácio de rácio de probabilidade ou probabilidades, e precisa de ser combinado com um antes de ser útil

5

$5$

H_{1}

$H_1$

5

$5$

H_{0}

$H_0$

— Henry

Se não temos nenhuma informação prévia específica, o que podemos dizer sobre o significado de AM?

— rnso

Certamente, alguém tem "algumas" informações prévias, mesmo dizendo que não há nenhuma informação prévia específica. Ou seja, nesse caso, é razoável atribuir probabilidades iguais a cada hipótese de acordo com o princípio da indiferença. Esse é um exemplo simples de um chamado prioritário não informativo (reconhecidamente um nome impróprio).

— dnqxt

Nesse caso, BF de 5 indicará uma hipótese com uma probabilidade 5x mais provável?

— rnso

Sim, mas esse problema é muito mais complicado do que parece e entra na área de seleção de modelos nas estatísticas. Você foi avisado :))

— dnqxt

Respostas:

Algumas coisas:

O BF fornece evidências a favor de uma hipótese, enquanto um teste de hipótese freqüente fornece evidências contra uma hipótese (nula). Então é como "maçãs para laranjas".

Esses dois procedimentos, apesar da diferença de interpretações, podem levar a decisões diferentes. Por exemplo, um AM pode rejeitar enquanto um teste de hipótese freqüentista não, ou vice-versa. Esse problema costuma ser chamado de paradoxo de Jeffreys-Lindley . Houve muitas postagens neste site sobre isso; ver, por exemplo aqui , e aqui .

"Nesse valor de P, a probabilidade H1 / H0 deve ser 95/5 ou 19." Não, isso não é verdade porque, aproximadamente . A computação de um valor de p e a realização de um teste freqüentista, no mínimo, não exigem que você tenha alguma idéia sobre . Além disso, os valores de p são frequentemente integrais / somas de densidades / pmfs, enquanto um BF não se integra no espaço de amostra de dados. $p(y \mid H_1) \neq 1- p(y \mid H_0)$ $p(y \mid H_1)$

— Taylor
fonte

Taylor está dizendo que o limiar de evidência contra uma hipótese ( ) não pode ser diretamente comparado ao limiar de evidência de outra hipótese ( ), também não aproximadamente. Quando você para de acreditar em um efeito nulo, não precisa se relacionar com quando você começa a acreditar em uma alternativa. Este é exatamente por isso que o -valor não deve ser interpretado como

H_{0}

$\text{H}_0$

H_{1}

$\text{H}_1$

p

$p$

1 - ({belief in H}_{1})

$1 - (\text{belief in H}_1)$

— Frans Rodenburg

Talvez isso possa ser esclarecedor: en.wikipedia.org/wiki/Misunderstandings_of_p-values O valor- freqüentista não é uma medida de evidência para nada.

p

$p$

— Frans Rodenburg

Desculpe, último comentário: o motivo pelo qual você não pode vê-lo como evidência a favor de é que é a chance de observar esse tamanho de efeito grande se for verdadeiro. Se é realmente verdadeiro, o valor- deve ser uniformemente aleatório, portanto seu valor não tem significado na probabilidade de . Essa sutileza na interpretação é uma das razões pelas quais os valores veem tanto mau uso.

H_{1}

$\text{H}_1$

H_{0}

$\text{H}_0$

H_{0}

$\text{H}_0$

p

$p$

H_{1}

$\text{H}_1$

p

$p$

— Frans Rodenburg

@ benzxyzzy: a distribuição de um valor- é uniforme apenas sob a hipótese nula, não sob a alternativa em que é fortemente inclinada para zero.

p

$p$

— Xi'an

@benxyzzy Para adicionar a outros: O objetivo de usar um valor- é que, sob a hipótese nula, ele é uniformemente aleatório; portanto, se você obtiver um valor- muito pequeno , isso sugere que talvez não seja uniformemente aleatório; talvez o valor nulo hipótese não era verdadeira.

p

$p$

p

$p$

— Jik

O fator Bayes $B_{01}$ pode ser transformado em probabilidade com pesos iguais como mas isso não os torna comparável com um valor- desde

P_{01} = \frac{1}{1 + \frac{1}{B_{01}}}

$P_{01}=\frac{1}{1+\frac{1}{\large B_{01}}}$

p

$p$

$P_{01}$ é uma probabilidade no espaço de parâmetro, não no espaço de amostragem
seu valor e alcance dependem da escolha da medida anterior; portanto, são relativos e não absolutos (e a menção de Taylor ao paradoxo de Lindley-Jeffreys é apropriada nesta fase )
tanto e conter uma penalidade para a complexidade (navalha de Occam), integrando sobre o espaço de parâmetros $B_{01}$ $P_{01}$

Se você quiser considerar uma Bayesian equivalente à -valor, a posterior preditivo -valor (Meng, 1994) deve ser investigada onde denota a observação e é distribuído a partir do preditivo posterior mas isso não implica que os mesmos critérios "padrão" para rejeição e significância se apliquem a esse objeto. $p$ $p$

Q_{01} = P (B_{01} (X) \leq B_{01} (x^{obs}))

$Q_{01}=\mathbb P(B_{01}(X)\le B_{01}(x^\text{obs}))$

x^{obs}

$x^\text{obs}$

X

$X$

X \sim \int_{Θ} f (x | θ) π (θ | x^{obs}) d θ

$X\sim \int_\Theta f(x|\theta) \pi(\theta|x^\text{obs})\,\text{d}\theta$

— Xi'an
fonte

Usando sua fórmula, P para BF de 3 e 10 resulta em 0,75 e 0,91, respectivamente. Por que devemos aceitá-las como evidência moderada, já que para o valor de P mantemos o ponto de corte de 0,95?

— rnso

Por que é relevante nessa estrutura? ou mesmo? Decidir quando grande é grande o suficiente depende da função do seu utilitário.

0.95

$0.95$

— Xian

A fórmula parece mais simples comoP = B/(B+1)

— rnso

Alguma de sua confusão pode resultar de pegar o número 95/5 diretamente do fato de o valor de p ser 0,05 - é isso que você está fazendo? Eu não acredito que isso esteja correto. O valor p para um teste t, por exemplo, reflete a chance de obter a diferença observada entre médias ou uma diferença mais extrema se a hipótese nula for de fato verdadeira. Se você obtiver um valor p de 0,02, você diz 'ah, há apenas 2% de chance de obter uma diferença como essa ou uma diferença maior, se o nulo for verdadeiro. Isso parece muito improvável, então proponho que o nulo não seja verdadeiro! '. Esses números não são exatamente a mesma coisa que entra no fator Bayes, que é a razão das probabilidades posteriores dadas a cada hipótese concorrente. Essas probabilidades posteriores não são calculadas da mesma maneira que o valor p,

Como uma observação lateral, eu sugeriria uma forte proteção contra pensar em diferentes valores de AM como significando coisas particulares. Essas atribuições são completamente arbitrárias, assim como o nível de significância 0,05. Problemas como o p-hacking ocorrerão com a mesma facilidade com os fatores Bayes se as pessoas começarem a acreditar que apenas números específicos justificam consideração. Tente entendê-los pelo que eles são, que são algo como probabilidades relativas, e use seu próprio senso para determinar se você encontra um número de namorado convincente ou não.

— Jamie
fonte

Por que os pontos de corte usados ​​para os fatores e valores p de Bayes são tão diferentes?

Por que os pontos de corte usados para os fatores e valores p de Bayes são tão diferentes?