Justificativa do teste de hipótese unilateral


35

Eu entendo o teste de hipótese bicaudal. Você tem (vs. ). O valor é a probabilidade de que gere dados pelo menos tão extremos quanto o que foi observado.H0 0:θ=θ0 0H1 1=¬H0 0:θθ0 0pθ

Eu não entendo o teste de hipótese unilateral. Aqui, (vs. ). A definição de valor-p não deveria ter mudado de cima: ainda deve ser a probabilidade de que gere dados pelo menos tão extremos quanto o que foi observado. Mas não sabemos , apenas que é delimitado por .H0 0:θθ0 0H1 1=¬H0 0:θ>θ0 0θ θθ0 0

Então, ao invés disso, vejo textos nos dizendo para assumir que (não conforme ) e calcular a probabilidade de que isso gere dados pelo menos tão extremos quanto o observado, mas apenas em uma extremidade . Isso parece não ter nada a ver com as hipóteses, tecnicamente.θ=θ0 0θθ0 0H0 0

Agora, entendo que esse é um teste de hipóteses freqüentista, e que os freqüentadores não colocam nenhum prior a . Mas isso não significa apenas que as hipóteses são impossíveis de aceitar ou rejeitar, em vez de incluir o cálculo acima na imagem?θ


Uma pergunta semelhante foi feita posteriormente stats.stackexchange.com/questions/8196/…
robin girard

11
Sua definição do valor- está incompleta. Deve-se ler (ênfase adicionada): O valor- é a probabilidade de que gere dados pelo menos tão extremos quanto o observado, assumindo que a hipótese nula seja verdadeira . ppθ
Alexis19 /

Respostas:


34

Essa é uma pergunta ponderada. Muitos textos (talvez por razões pedagógicas) abordam essa questão. O que realmente está acontecendo é que é uma "hipótese" composta em sua situação unilateral: na verdade, é um conjunto de hipóteses, não uma única. É necessário que para todas as hipóteses possíveis emH0 0 H0 0, a chance da estatística de teste cair na região crítica deve ser menor ou igual ao tamanho do teste. Além disso, se o teste realmente atingir seu tamanho nominal (o que é bom para obter alta potência), o supremo dessas chances (assumidas todas as hipóteses nulas) deve ser igual ao tamanho nominal. Na prática, para testes simples de localização de um parâmetro envolvendo certas famílias "agradáveis" de distribuições, esse supremo é atingido para a hipótese com o parâmetro . Assim, como uma questão prática, todo o cálculo se concentra nessa única distribuição. Mas não devemos esquecer o resto do conjunto : essa é uma distinção crucial entre testes frente e verso e frente e verso (e entre "simples" e "composto"θ0 0H0 0

Isso influencia sutilmente a interpretação dos resultados de testes unilaterais. Quando o nulo é rejeitado, podemos dizer que a evidência aponta contra o verdadeiro estado da natureza, sendo qualquer uma das distribuições em . Quando o nulo não é rejeitado, podemos apenas dizer que existe uma distribuição em H 0 que é "consistente" com os dados observados. Estamos não dizendo que todas as distribuições em H 0 são consistentes com os dados: longe disso! Muitos deles podem gerar probabilidades extremamente baixas.H0 0H0 0H0 0


Tudo o que você disse é válido e importante. Outro aspecto importante, penso eu, é que geralmente a hipótese nula é vista como hipótese desinteressante. A alternativa é vista como a hipótese científica. É o que o pesquisador gostaria de provar. Eu digo geralmente porque é diferente nos testes de equivalência e não inferioridade. Agora, com relação à questão do teste unilateral, basta dizer o lado que tem parâmetro maior que o valor nulo que é interessante. Portanto, todos os valores no lado menor que são incorporados no nulo.
Michael R. Chernick

stats.stackexchange.com/questions/333301/… Se você quiser dar uma resposta a esta pergunta ou me indicar uma bibliografia ...;)
Um homem velho no mar.

6

Eu vejo o valor- como a probabilidade máxima de um erro do tipo I. Se θ θ 0 , a probabilidade de uma taxa de erro do tipo I pode ser efetivamente zero, mas também é assim. Ao olhar para o teste de uma perspectiva minimax, um adversário nunca se retiraria das profundezas do "interior" da hipótese nula, e o poder não deveria ser afetado. Para situações simples (o teste t , por exemplo), é possível construir um teste com uma taxa máxima garantida do tipo I, permitindo tais hipóteses nulas de um lado.pθθ0 0t


2

Você usaria um teste de hipótese unilateral se apenas os resultados em uma direção apoiarem a conclusão que você está tentando chegar.

Pense nisso em termos da pergunta que você está fazendo. Suponha, por exemplo, que você queira ver se a obesidade leva ao aumento do risco de ataque cardíaco. Você coleta seus dados, que podem consistir em 10 pessoas obesas e 10 não obesas. Agora, digamos que, devido a fatores de confusão não registrados, design experimental ruim ou má sorte, observe que apenas 2 das 10 pessoas obesas têm ataques cardíacos, em comparação com 8 das pessoas não obesas.

Agora, se você realizasse um teste de hipótese bidirecional com esses dados, concluiria que havia uma associação estatisticamente significativa (p ~ 0,02) entre obesidade e risco de ataque cardíaco. No entanto, a associação estaria na direção oposta àquela que você realmente esperava ver, portanto, o resultado do teste seria enganoso.

(Na vida real, um experimento que produziu um resultado tão contra-intuitivo pode levar a perguntas adicionais interessantes: por exemplo, o processo de coleta de dados pode precisar ser aprimorado ou pode haver fatores de risco anteriormente desconhecidos no trabalho, ou talvez a sabedoria convencional esteja simplesmente equivocada, mas essas questões não estão realmente relacionadas à questão restrita de que tipo de teste de hipótese usar.)


2

pH0 0H0 00,5H1 10,5

H0 0H0 00,75H1 10,25

H1 1H0 0H0 0

Você pode experimentar este exemplo de brinquedo em R, tente também diferentes números absolutos e combinações de cara e coroa:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.