Um valor-p é a probabilidade de obter uma estatística que seja pelo menos tão extrema quanto a observada nos dados da amostra ao assumir que a hipótese nula ( ) é verdadeira.
Graficamente, isso corresponde à área definida pela estatística da amostra sob a distribuição amostral que se obteria ao assumir :
No entanto, como a forma dessa distribuição assumida é realmente baseada nos dados da amostra, centralizá-la em parece uma escolha estranha para mim.
Se alguém usasse a distribuição amostral da estatística, ou seja, centralize a distribuição na estatística da amostra, o teste de hipóteses corresponderia à estimativa da probabilidade de dadas as amostras.μ 0
Nesse caso, o valor p é a probabilidade de obter uma estatística pelo menos tão extrema quanto dados os dados em vez da definição acima.
Além disso, essa interpretação tem a vantagem de se relacionar bem com o conceito de intervalos de confiança:
um teste de hipótese com nível de significância seria equivalente a verificar se enquadra no intervalo de confiança da distribuição da amostra.μ 0 ( 1 - α )
Portanto, sinto que centralizar a distribuição em pode ser uma complicação desnecessária.
Existem justificativas importantes para esta etapa que eu não considerei?