Por que os erros do tipo II nos testes de hipóteses são considerados erros?


8

Estou lendo sobre erros de decisão no teste de hipóteses. Minha pergunta é por que um "erro tipo II" é considerado algum erro? Pelo que entendi, surge quando deixamos de rejeitar uma hipótese nula falsa. Quando falhamos em rejeitar a hipótese nula, significa simplesmente que não temos fortes evidências para rejeitá-la. Não estamos fazendo nenhum comentário sobre qual das duas hipóteses é verdadeira (ou falsa) - nenhuma delas pode ser verdadeira. Não estamos dizendo que a hipótese nula seja verdadeira. Portanto, por que essa conclusão é chamada de erro?

Respostas:


5

É porque não estamos fazendo o que devemos fazer quando a hipótese alternativa é verdadeira. Por exemplo, não estamos usando o novo medicamento que é realmente melhor que o existente, mas não conseguimos provar.


Seguindo essa lógica, deixar de rejeitar uma hipótese nula verdadeira não deve ser um verdadeiro positivo. Deve ser um erro, porque não estamos fazendo o que devemos fazer quando a hipótese nula é verdadeira.
Sanket Kedia

1
Por que você diz isso? É claro que estamos fazendo o que devemos fazer quando a hipótese nula é verdadeira - estamos mantendo o comportamento atual, que é a coisa correta a ser feita sob sua suposição de que a hipótese nula é verdadeira.
Zahava Kor

Conectar o NHST às ações que normalmente acontecem, como Zahava Kor faz aqui, parece a maneira mais simples e direta de apreciar os erros do Tipo II como 'erros'. Em alguns contextos, como o do desenvolvimento de drogas que Zahava Kor cita especificamente, o NHST está incorporado em um plano de ação, de modo que o resultado epistêmico do teste determine ações. Em relação à medicina em geral, ajuda a apreciar o magnífico Six Dangerous Words JAMA da EBM de
David C. Norris

4

Como queremos usar a palavra "erro" é, em última análise, uma questão semântica, e pessoas razoáveis ​​podem discordar sobre se, e em que sentido, devemos considerar um falso negativo como um erro .

  • Por um lado, acho que você está certo de que um resultado não significativo realmente significa apenas que não temos informações suficientes para ter certeza de que a hipótese nula é falsa e que isso não implica logicamente que a hipótese nula é verdadeira ( cf., Por que os estatísticos dizem que um resultado não significativo significa "você não pode rejeitar o nulo" em vez de aceitar a hipótese nula? ). Portanto, dado o nível de confiança necessário em sua situação e o nível de ambiguidade em seus dados, você tomou a decisão certa no sentido de ter aplicado corretamente a regra que havia decidido.
  • Por outro lado, se você se colocar na posição de alguém que está planejando um estudo. Eles querem saber se o nulo é falso. Se for realmente falso, eles querem ir embora depois que o estudo for concluído, tendo rejeitado a hipótese nula. Em vez disso, eles permaneceriam incertos sobre o assunto e talvez precisassem projetar e executar outro estudo. Nessa perspectiva, não rejeitar um nulo falso é definitivamente um resultado subótimo.

3
+1. Mas pode ser apropriado trazer a questão de Fisher x Neyman-Pearson aqui (vou apontar para sua própria resposta legal: stats.stackexchange.com/questions/23142 ). O OP está fazendo a pergunta no que parece ser o paradigma dos pescadores. Mas o erro tipo II é um conceito do paradigma Neyman-Pearson. Portanto, acredito, a confusão do OP.
Ameba

1

A palavra 'falha' está próxima de 'erro'.

Para mim, o termo erro faz sentido, pois você pode calcular uma probabilidade de ocorrência (desde que você defina um certo tamanho mínimo de efeito que seria desejável detectar). E você deseja calcular essa probabilidade em situações em que deseja que ela seja pequena. Nessas situações, a falha seria considerada um erro.

Para mim, é muito simétrico com erros do tipo I.

Como os valores-p, que se relacionam ao erro do tipo I, você também pode calcular a probabilidade de (falsamente) não rejeitar a hipótese nula. Para um determinado tamanho de efeito e um determinado teste (por exemplo, número de medições), é possível calcular com que probabilidade essa 'falha' pode ocorrer.

Estes pensamentos não exigem que você definir um limite para a hipótese nula.

pαH0 0


1
Na verdade, o erro real é testar a hipótese.
Sextus Empiricus
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.