P = 5,0% é significativo?

14

Hoje me perguntaram se um valor de p de 0,05 (exatamente) é considerado significativo (dado alfa = 5%) ou não. Eu não sabia a resposta e o Google encontrou as duas respostas: (a) o resultado é significativo se p for menor que 5% e (b) se p for menor que 5% ou igual a 5%.

Obviamente, nenhum desses sites citou ninguém. Por que alguém deveria - é de conhecimento geral e os 5% são arbitrários, de qualquer maneira. Mas isso não vai me ajudar a dizer aos meus alunos algo para se lembrar.

Então, aqui estão minhas perguntas desesperadas sobre o teste de hipóteses: Se o valor-p é exatamente o alfa - considero o resultado significativo ou não? E qual é a citação autoral neste caso?

Muito obrigado

hypothesis-testing statistical-significance p-value

— BurninLeo
fonte

19

Deixando de lado algumas questões práticas (como a extensão em que é arbitrário, por exemplo), as definições de nível de significância e valor-p tornam a resposta a essa pergunta inequívoca. $\alpha$

Ou seja, formalmente, a regra de rejeição é que você rejeita quando . $p = \alpha$

Realmente deve importar apenas para o caso discreto, mas nessa situação, se você não rejeitar quando , sua taxa de erro do tipo I não será realmente ! $p=\alpha$ $\alpha$

(No que me diz respeito, não há citação 'autoritária'; você realmente precisa entender as abordagens de Neyman-Pearson e dos Pescadores dos testes de hipóteses, e é algo que se desenvolveu ao longo do tempo.)

Há vários textos estatísticos bons que descrevem o teste de hipóteses corretamente.

A definição do valor-p é dada corretamente na primeira frase do artigo relevante da Wikipedia *:

o valor p é a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto a que foi realmente observada, assumindo que a hipótese nula seja verdadeira.

* (e não, a Wikipedia não é uma autoridade, estou apenas dizendo que a definição está correta)

Para simplificar, vamos ficar com pontos nulos; serve para transmitir o ponto sem atrapalhar as águas com outros problemas.

Agora, o nível de significância, $\alpha$ $p$ $\alpha$

** Bem, acho que estou limitando minha discussão a apenas estatísticas de teste distribuídas de maneira puramente discreta ou puramente contínua. No caso misto, você pode descobrir como a minha discussão discreta se aplica (nas situações em que se aplica).

$n=17$ $\alpha = 4.904\%$ $\frac{137500}{2^{17}}$

$H_0$ $p=\alpha$ $\alpha$

$p=\alpha$

[Agora, vamos considerar sua situação. É o seu valor p $p=\alpha$

Se você descrever sua regra de rejeição com antecedência e mostrar que (se as suposições forem atendidas), ela tiver o nível de significância desejado, provavelmente não haverá necessidade de referências.

Uma regra de rejeição é simplesmente uma declaração sobre quais valores da estatística de teste farão com que você rejeite $H_0$

$\alpha$

(Se você tiver uma edição diferente, os números das páginas podem mudar, mas ele possui um índice, para que você possa procurar termos; tenha cuidado, talvez seja necessário consultar as listagens em 'Teste de hipóteses' ou algo semelhante no índice para encontrar 'região de rejeição')

Hmm, vamos tentar outro livro da prateleira. Wackerly, Mendenhall e Scheaffer Mathematics Statistics with Applications, 5ª edição , define uma região de rejeição na p412 e um valor-p (a mesma definição de C&B) na p431.

— Glen_b -Reinstate Monica
fonte

Obrigado. Por favor, permita-me a pergunta estúpida de um "usuário prático de estatística": onde, exceto a Wikipedia, encontrarei essa definição e / ou regra de rejeição, você se refere? Examinei alguns livros de estatística, mas não encontrei a passagem. Provavelmente procurando as palavras erradas ...

— BurninLeo

veja as atualizações para responder

— Glen_b -Reinstate Monica

Você é ótimo! Claro, você sabia disso, mas às vezes vale a pena afirmar de qualquer maneira. Muito obrigado!

— BurninLeo

1

(+1) Resposta muito boa.

— chl

2

Uma confissão interessante que eu aprendi na aula de bioestatística de um professor é que o nível de significância de 0,05 foi mais alcançado por um consenso do que por uma verdade de ouro. Desde então, tenho visto literatura que flerta com o nível de significância de 0,05, como "aproximar-se" de ainda ser uma descoberta impressionante do estudo e ouvi argumentos de que o nível de significância de 0,05 pode não se aplicar a todos os campos de pesquisa. Com isso dito, achei estimativas pontuais e intervalos de confiança mais informativos que os níveis de significância. Aqui está um artigo interessante sobre o assunto (para mim de qualquer maneira).

— user2300643
fonte

Obrigado pela referência @ user2300643. E obrigado por evitar a barreira financeira para acessar!

— doug.numbers

Há uma discussão interessante sobre as origens dos níveis de significância de 5% etc aqui .

— Glen_b -Reinstala Monica

0

O valor de p é geralmente definido para consenso como dito anteriormente (ou melhor, preguiça). Para realmente poder dizer que algo é significativo, precisamos encontrar o valor de p que corresponde ao tamanho do efeito, tamanho da amostra e quão rigoroso você deseja que seja para seus dados. Isso é chamado de análise de energia (é um subcampo dentro das estatísticas). Muitas pessoas não estão cientes ou simplesmente não o usam porque não é simples. Isso não quer dizer que está tudo bem do jeito que está. Devemos sempre fazer esse tipo de estudo para extrair inferências realmente significativas.

— raygozag
fonte