Portanto, essa pode ser uma pergunta comum, mas nunca encontrei uma resposta satisfatória.
Como você determina a probabilidade de a hipótese nula ser verdadeira (ou falsa)?
Digamos que você dê aos alunos duas versões diferentes de um teste e queira ver se as versões eram equivalentes. Você realiza um teste t e ele fornece um valor-p de 0,02. Que bom valor p! Isso deve significar que é improvável que os testes sejam equivalentes, certo? Não. Infelizmente, parece que P (resultados | nulo) não informa P (nulo | resultados). O normal é rejeitar a hipótese nula quando encontramos um valor p baixo, mas como sabemos que não estamos rejeitando uma hipótese nula que provavelmente é verdadeira? Para dar um exemplo bobo, posso projetar um teste para o ebola com uma taxa de falsos positivos de 0,02: coloque 50 bolas em um balde e escreva “ebola” em um. Se eu testar alguém com isso e ele pegar a bola “ebola”, o valor de p (P (pegar a bola | eles não têm ebola)) é 0,02,
Coisas que eu considerei até agora:
- Assumindo P (nulo | resultados) ~ = P (resultados | nulo) - claramente falso para algumas aplicações importantes.
- Aceite ou rejeite a hipótese sem conhecer P (nulo | resultados) - Por que estamos aceitando ou rejeitando-os então? Não é o ponto principal que rejeitamos o que pensamos ser provavelmente falso e aceitamos o que é provavelmente verdadeiro?
- Use o Teorema de Bayes - Mas como você consegue seus priores? Você não acaba no mesmo lugar tentando determiná-los experimentalmente? E escolhê-los a priori parece muito arbitrário.
- Encontrei uma pergunta muito semelhante aqui: stats.stackexchange.com/questions/231580/. A única resposta aqui parece dizer basicamente que não faz sentido perguntar sobre a probabilidade de uma hipótese nula ser verdadeira, já que essa é uma pergunta bayesiana. Talvez eu seja um bayesiano de coração, mas não consigo imaginar não fazer essa pergunta. De fato, parece que o mal-entendido mais comum dos valores-p é que eles são a probabilidade de uma verdadeira hipótese nula. Se você realmente não pode fazer essa pergunta como freqüentador, minha pergunta principal é # 3: como você consegue seus prévios sem ficar preso em um loop?
Edit: Obrigado por todas as respostas atenciosas. Quero abordar alguns temas comuns.
- Definição de probabilidade: Tenho certeza de que há muita literatura sobre isso, mas minha concepção ingênua é algo como "a crença de que um ser perfeitamente racional daria a informação" ou "as chances de apostas que maximizariam o lucro se a situação foi repetido e as incógnitas foram autorizadas a variar ".
- Podemos conhecer P (H0 | resultados)? Certamente, essa parece ser uma pergunta difícil. Acredito, porém, que toda probabilidade é teoricamente conhecível, uma vez que a probabilidade é sempre condicional à informação fornecida. Todo evento irá acontecer ou não, portanto, a probabilidade não existe com informações completas. Ele existe apenas quando há informações insuficientes, portanto deve ser conhecido. Por exemplo, se me disserem que alguém tem uma moeda e perguntarem a probabilidade de cara, eu diria 50%. Pode acontecer que a moeda tenha um peso de 70% para as cabeças, mas eu não recebi essas informações, então a probabilidade foi de 50% para as informações que eu tinha, assim como, mesmo que caia sobre as caudas, a probabilidade foi de 70% cabeças quando eu aprendi isso. Como a probabilidade é sempre condicional a um conjunto de dados (insuficientes),
Edit: "Always" pode ser um pouco forte demais. Pode haver algumas questões filosóficas para as quais não podemos determinar a probabilidade. Ainda assim, em situações do mundo real, embora possamos "quase nunca" ter certeza absoluta, deve "quase sempre" haver uma melhor estimativa.