É possível provar uma hipótese nula?


37

Como afirma a pergunta - É possível provar a hipótese nula? Do meu entendimento (limitado) da hipótese, a resposta é não, mas não posso apresentar uma explicação rigorosa para ela. A pergunta tem uma resposta definitiva?


4
Depende do que você quer dizer com "provar". Como afirmado, essa é uma pergunta filosófica, não estatística, e não tem resposta definitiva (embora, pelo menos desde a época de David Hume, a maioria das pessoas respondesse "não").
whuber

Essa é uma pergunta mal colocada. Precisamos conhecer as condições sob as quais essa "prova" deve ocorrer.
probabilityislogic

Talvez uma pergunta melhor colocada seja "Em que condições / suposições é possível provar a hipótese nula?"
probabilityislogic

Respostas:


19

Se você está falando sobre o mundo real e não sobre a lógica formal, a resposta é clara. A "prova" de qualquer coisa por meios empíricos depende da força da inferência que se pode fazer, que por sua vez é determinada pela validade do processo de teste, avaliado à luz de tudo o que se sabe sobre como o mundo funciona (isto é, teoria). Sempre que alguém aceita que certos resultados empíricos justificam a rejeição da hipótese "nula", está necessariamente fazendo julgamentos desse tipo (validade do design; o mundo funciona de certa maneira), portanto, é necessário fazer as suposições análogas necessárias para justificar a "prova da null " não é problemático.

Então, quais são as suposições análogas? Aqui está um exemplo de "provar o nulo" que é comum nas ciências da saúde e nas ciências sociais. (1) Defina "nulo" ou "sem efeito" de alguma maneira que seja praticamente significativa. Digamos que acredito que devo me comportar como se não houvesse diferença significativa entre dois tratamentos, t1 e t2, para uma doença, a menos que um dê uma chance 3% maior de recuperação do que o outro. (2) Descubra um design válido para testar se há algum efeito - nesse caso, se há uma diferença na probabilidade de recuperação entre t1 e t2. (3) Faça uma análise de poder para determinar se o tamanho da amostra é necessário para gerar uma probabilidade suficientemente alta - na qual estou confiante, dependendo do que 'assumindo que existe. Geralmente, as pessoas dizem que o poder é suficiente se a probabilidade de observar um efeito especificado em um alfa especificado for pelo menos 0,80, mas o nível certo de confiança é realmente uma questão de quão avesso você é ao erro - o mesmo que quando você seleciona p limiar de valores para "rejeitar o nulo". (4) Realize o teste empírico e observe o efeito. Se estiver abaixo do valor "diferença significativa" especificado - 3% no meu exemplo - você "provou" que "não há efeito".

Para um bom tratamento desse assunto, consulte Streiner, DL Unicorns Do: existe um tutorial sobre “provar” a hipótese nula . Canadian Journal of Psychiatry 48, 756-761 (2003).


11
+1. Este é um bom exemplo da importância de ser claro sobre o padrão de "prova" de alguém. Em muitas aplicações, a que você invoca aqui - o padrão "aja como se", se é que posso chamar assim - é tão fraca que ninguém a aceitaria como "prova". Porém, não nego sua utilidade e defendo esse tipo de abordagem para apoiar a tomada de decisão racional. (Mas talvez os métodos bayesianos sejam melhores ... :-)
whuber

11
(+1) Boa resposta. Adicionei um link para uma versão online do artigo de Streiner; Espero que você não se importe (sinta-se à vontade para remover).
chl

11
mais algumas coisas: (1) Tratar a falha em rejeitar o nulo como evidência em apoio ao nulo é um erro chocante comum e uma ocasião usual para o argumento de Streiner. Esse erro transforma essencialmente a forte aversão ao erro do tipo 1 na norma "p <0,05" em licença para o tipo 2. S diz: "espere - você precisa de energia ..." (2) Whuber cita o famoso argumento de Hume. O pt de H é na verdade tão subversivo das provas empíricas que rejeitam o nulo quanto das provas do nulo. H diz que a indução não pode suportar inferência causal. Está bem; mas não há alternativa para o estudo empírico! Vá Pearl (e Bayes), não Hume, sobre causalidade!
dmk38

11
esta pergunta sobre o teste de equivalência também tem algumas boas sugestões stats.stackexchange.com/questions/3038/…
Jeromy Anglim

Isso equivale a assumir "não o nulo" como a nova hipótese nula e, em seguida, rejeitar essa nova hipótese nula?

16

Resposta do lado matemático: é possível se e somente se "as hipóteses são mutuamente singulares".

Se por "provar" você quer dizer uma regra que pode "aceitar" (devo dizer isso :)) com probabilidade de cometer um erro que é zero, então você está pesquisando o que poderia ser chamado de "teste ideal" e isso existe:H0

Se você estiver testando se uma variável aleatória é extraída de P 0 ou de P 1 (ou seja, teste H 0 : X P 0 versus H 1 : X P 1 ), existe um teste ideal se e somente se P 1P 0 ( P 1 e P 0 são "mutuamente singulares"). XP0P1H0:XP0H1:XP1 P1P0P1P0

Se você não sabe o que significa "mutuamente singular", posso dar um exemplo: e U [ 3 , 4 ] (uniformes em [ 0 , 1 ] e [ 3 , 4 ] ) são mutuamente singulares . Isso significa que se você quiser testarU[0,1]U[3,4][0,1][3,4]

versus H 1 : X U [ 3 , 4 ]H0:XU[0,1]H1:XU[3,4]

existe um teste ideal (adivinhe o que é :)): um teste que nunca está errado!

Se e P 0 não são mutuamente singulares, isso não existe (isso resulta do "somente se parte")!P1P0

Em termos não matemáticos, isso significa que você pode provar o nulo se e somente se a prova já estiver em suas suposições (ou seja, se e somente se você tiver escolhido as hipóteses e H 1 que são tão diferentes que uma única observação de H 0 não pode ser identificado como um de H 1 e vice-versa). H0H1H0H1


4
+1 boa resposta. Uma renderização simples da matemática é que se supõe que o nulo e suas alternativas produzam conjuntos de resultados disjuntos; por exemplo, ou há uma zebra nesta sala ou não. É claro que "provar" aqui inclui implicitamente "condicional ao modelo", que nunca é estabelecido com o mesmo rigor que, digamos, um teorema matemático; inclui implicitamente "condicional à precisão das observações"; e inclui implicitamente que as hipóteses podem ser inequivocamente interpretadas. (Para críticas a este último, veja Mulheres, fogo e coisas perigosas , de George Lakoff . )
whuber

11

Sim, existe uma resposta definitiva. Essa resposta é: Não, não há como provar uma hipótese nula. O melhor que você pode fazer, tanto quanto eu sei, é jogar intervalos de confiança em torno de sua estimativa e demonstrar que o efeito é tão pequeno que pode muito bem ser essencialmente inexistente.


4
De maneira mais geral, o problema nas estatísticas não é que você não consiga provar a hipótese nula; é que não é possível fazer estimativas pontuais com certeza. Ou seja, assim como você não pode dizer "não há efeito da variável", não é possível dizer que "o tamanho do efeito da variável é 1,95". As estatísticas sempre têm intervalos de confiança.
precisa saber é o seguinte

11
Concordou que a resposta é um grande NÃO, e por uma razão muito forte: através da construção de hipóteses estatísticas. O fato de a resposta aceita reivindicar o contrário é absolutamente trágico. O que o teste de hipóteses fornece como resposta é: supondo que minha hipótese seja verdadeira , os dados que eu amostramos são consistentes com ela? E de maneira alguma o contrário. Não é preciso muito raciocínio para entender que você não pode deduzir disso se a hipótese é verdadeira ou não.
Christophe

4

Para mim, o referencial teórico da decisão apresenta a maneira mais fácil de entender a "hipótese nula". Diz basicamente que deve haver pelo menos duas alternativas: a hipótese nula e pelo menos uma alternativa. Então, o "problema de decisão" é aceitar uma das alternativas e rejeitar as outras (embora seja preciso ser preciso sobre o que queremos dizer com "aceitar" e "rejeitar" a hipótese). Vejo a questão de "podemos provar a hipótese nula?" como análogo a "sempre podemos tomar a decisão correta?". Do ponto de vista da teoria da decisão, a resposta é claramente sim se

1) não há incerteza no processo de tomada de decisão, pois é um exercício matemático descobrir qual é a decisão correta.

2) aceitamos todas as outras premissas / premissas do problema. A mais crítica (eu acho) é que as hipóteses entre as quais estamos decidindo são exaustivas, e uma (e apenas uma) delas deve ser verdadeira e as outras devem ser falsas.

De um ponto de vista mais filosófico, não é possível "provar" nada, no sentido de que a "prova" depende inteiramente das suposições / axiomas que levam a essa "prova". Vejo a prova como um tipo de equivalência lógica, e não como um "fato" ou "verdade", no sentido de que, se a prova estiver errada, as suposições que levaram a ela também estarão erradas.

Aplicando isso à "comprovação da hipótese nula", posso "provar" que ela é verdadeira simplesmente assumindo que é verdadeira ou supondo que seja verdadeira se certas condições forem atendidas (como o valor de uma estatística).


3

Sim, é possível provar o nulo - exatamente no mesmo sentido em que é possível provar qualquer alternativa ao nulo. Em uma análise bayesiana, é perfeitamente possível que as probabilidades a favor do nulo versus qualquer uma das alternativas propostas a ele se tornem arbitrariamente grandes. Além disso, é falso afirmar, como algumas das respostas acima afirmam, que só se pode provar o nulo se as alternativas a ele forem desunidas (não se sobreponham ao nulo). Em uma análise bayesiana, toda hipótese tem uma distribuição de probabilidade anterior. Essa distribuição espalha uma massa unitária de probabilidade anterior entre as alternativas propostas. A hipótese nula coloca toda a probabilidade anterior em uma única alternativa. Em princípio, alternativas ao nulo podem colocar toda a probabilidade anterior em alguma alternativa não nula (em outro "ponto"), mas isso é raro. Em geral, as alternativas protegem, ou seja, espalham a mesma massa de probabilidade anterior por outras alternativas - excluindo a alternativa nula ou, mais comumente, incluindo a alternativa nula. A questão então se torna: qual hipótese coloca a probabilidade mais anterior onde os dados experimentais realmente caem. Se os dados caírem em torno de onde o nulo diz que eles devem cair, será a favor da probabilidade (entre as hipóteses propostas), MESMO QUE INCLUÍDO (NESTADO EM, NÃO MUTUAMENTE EXCLUSIVO COM) AS ALTERNATIVAS A ELE. A crença de que não é possível que uma alternativa aninhada seja mais provável do que o conjunto em que está aninhada reflete a falha em distinguir entre probabilidade e probabilidade. Embora seja impossível para um componente de um conjunto ser menos provável que o conjunto inteiro, é perfeitamente possível que a probabilidade posterior de um componente de um conjunto de hipóteses seja maior que a probabilidade posterior do conjunto como um todo. A probabilidade posterior de uma hipótese é o produto da função de probabilidade e a distribuição de probabilidade anterior que a hipótese apresenta. Se uma hipótese coloca toda a probabilidade anterior no lugar certo (por exemplo, no nulo), ela terá uma probabilidade posterior mais alta do que uma hipótese que coloca parte da probabilidade anterior no lugar errado (não no nulo). A probabilidade posterior de uma hipótese é o produto da função de probabilidade e a distribuição de probabilidade anterior que a hipótese apresenta. Se uma hipótese coloca toda a probabilidade anterior no lugar certo (por exemplo, no nulo), ela terá uma probabilidade posterior mais alta do que uma hipótese que coloca parte da probabilidade anterior no lugar errado (não no nulo). A probabilidade posterior de uma hipótese é o produto da função de probabilidade e a distribuição de probabilidade anterior que a hipótese apresenta. Se uma hipótese coloca toda a probabilidade anterior no lugar certo (por exemplo, no nulo), ela terá uma probabilidade posterior mais alta do que uma hipótese que coloca parte da probabilidade anterior no lugar errado (não no nulo).


2

Tecnicamente, não, uma hipótese nula não pode ser comprovada. Para qualquer tamanho de amostra fixo e finito, sempre haverá um tamanho de efeito pequeno, mas diferente de zero, para o qual seu teste estatístico praticamente não tem poder. Mais praticamente, porém, você pode provar que está dentro de um pequeno epsilon da hipótese nula, de modo que desvios menores que esse epsilon não sejam praticamente significativos.


2

Há um caso em que uma prova é possível. Suponha que você tenha uma escola e sua hipótese nula seja que o número de meninos e meninas seja igual. À medida que o tamanho da amostra aumenta, a incerteza na proporção de meninos e meninas tende a diminuir, chegando a ter certeza (que é o que eu suponho que você queira dizer com prova) quando toda a população de alunos é amostrada.

Porém, se você não possui uma população finita ou está fazendo uma amostragem com substituição e não consegue identificar indivíduos reamostrados, não é possível reduzir a incerteza a zero com uma amostra finita.


0

Eu gostaria de discutir aqui um ponto em que muitos usuários estão confusos. Qual é o verdadeiro significado da afirmação de Hipótese Nula H0: p = 0? Estamos tentando determinar se o parâmetro p é zero? Claro que não, não há como alcançar esse objetivo.

O que pretendemos estabelecer é que, dado o conjunto de dados, o valor do parâmetro avaliado seja (ou não) indiscernível de zero. Lembre-se de que o NHST é "injusto" em relação às hipóteses alternativas: ao nulo é atribuído um nível de confiança de 95% e apenas 5% à alternativa. Em conseqüência, um resultado "não significativo" não significa que H0 seja válido, mas simplesmente que não encontramos evidências suficientes de que a alternativa é provável.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.