Eu não acho que a maioria dessas respostas realmente responda à pergunta em geral. Eles são restritos ao caso em que existe uma hipótese nula simples e quando a estatística do teste possui um CDF invertível (como em uma variável aleatória contínua que possui um CDF estritamente crescente). Esses casos são os casos com os quais a maioria das pessoas se preocupa com os testes z e t, embora, para testar uma média binomial (por exemplo), não se tenha esse CDF. O que é fornecido acima parece correto aos meus olhos para esses casos restritos.
Se hipóteses nulas são compostas, as coisas são um pouco mais complicadas. A prova mais geral desse fato que eu já vi no caso composto usando algumas suposições sobre regiões de rejeição é fornecida nas "Testando Hipóteses Estatísticas" de Lehmann e Romano, páginas 63-64. Vou tentar reproduzir o argumento abaixo ...
Nós testamos a hipótese nula contra uma hipótese alternativa com base em uma estatística de teste, que vamos denotar como a variável aleatória . Supõe-se que a estatística de teste venha de alguma classe paramétrica, ou seja, , em que é um elemento da família de distribuições de probabilidade e é um espaço de parâmetro. A hipótese nula e a hipótese alternativa formam uma partição de em
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
onde
Θ0∩Θ1=∅.
O resultado do teste pode ser indicado como
onde, para qualquer conjunto , definimos
Aqui é o nosso nível de significância e indica a região de rejeição do teste para o nível de significância .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Suponha que as regiões de rejeição atendam ao
se . Nesse caso de regiões de rejeição aninhadas, é útil determinar não apenas se a hipótese nula é ou não rejeitada em um determinado nível de significância , mas também determinar o menor nível de significância para o qual a hipótese nula seria rejeitada. Esse nível é conhecido como valor-p ,
Esse número nos dá uma idéia de quão forte os dados (conforme retratados pela estatística do teste ) contradizem a hipótese nula . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Suponha que para alguns e . Suponha adicionalmente que as regiões de rejeição obedeçam à propriedade de aninhamento mencionada acima. Em seguida, o seguinte vale:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Se para todos os , então para ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Se para , temos para todos os , então para , temos
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Observe que essa primeira propriedade apenas nos diz que a taxa de falso positivo é controlada em rejeitando quando o valor de p é menor que , e a segunda propriedade nos diz (dada uma suposição adicional) que os valores de p são distribuídos uniformemente sob o valor nulo hipótese.uu
A prova é a seguinte:
Deixe e assuma para todos os . Então, por definição de , temos para todos os . Pela monotonicidade e pelo pressuposto, segue-se que para todos os . Deixando , segue-se que .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Deixe e assuma que para todos os . Então e, por monotonicidade, segue-se que . Considerando (1), segue-se que . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Observe que a suposição em (2) não se aplica quando uma estatística de teste é discreta, mesmo que a hipótese nula seja simples e não composta. Tomemos, por exemplo, com e . Ou seja, jogue uma moeda dez vezes e teste se é justo versus inclinado em direção às cabeças (codificado como 1). A probabilidade de ver 10 caras em 10 lançamentos justos de moedas é (1/2) ^ 10 = 1/1024. A probabilidade de ver 9 ou 10 caras em 10 lançamentos justos de moedas é 11/1024. Para qualquer estritamente entre 1/1024 e 11/1024, você rejeitaria o nulo se , mas não temos esse para esses valores de quandoX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Em vez disso, para esse . Pr(X∈Rα)=1/1024α