O valor P é definido como a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto a observada, assumindo que a hipótese nula é verdadeira. Em outras palavras,
Mas e se a estatística-teste for bimodal na distribuição? valor-p significa alguma coisa neste contexto? Por exemplo, vou simular alguns dados bimodais no R:
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
E vamos supor que observamos um valor estatístico de teste de 60. E aqui sabemos pela figura que esse valor é muito improvável . Então, idealmente, eu gostaria de um procedimento estatístico que eu use (digamos, valor-p) para revelar isso. Mas se calcularmos o valor p conforme definido, obteremos um valor muito alto
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
Se eu não conhecesse a distribuição, concluiria que o que observei é simplesmente por acaso. Mas sabemos que isso não é verdade.
Acho que a pergunta que tenho é: Por que, ao calcular o valor p, calculamos a probabilidade dos valores "pelo menos tão extremos quanto" os observados? E se eu encontrar uma situação como a que simulei acima, qual é a solução alternativa?