Por que precisamos de hipóteses alternativas?

13

Quando fazemos testes, acabamos com dois resultados.

1) Rejeitamos hipóteses nulas

2) Falhamos em rejeitar a hipótese nula.

Não falamos em aceitar hipóteses alternativas. Se não falamos em aceitar hipóteses alternativas, por que precisamos ter hipóteses alternativas?

Aqui está a atualização: Alguém poderia me dar dois exemplos:

1) rejeitar hipótese nula é igual a aceitar hipótese alternativa

2) rejeitar hipótese nula não é igual a aceitar hipótese alternativa

hypothesis-testing

— user1700890
fonte

1

Porque você está tentando tirar algumas conclusões. Se não for a hipótese nula, talvez seja a hipótese alternativa (mesmo que você não tenha certeza absoluta de que a hipótese alternativa é válida, se você rejeitar a hipótese nula). Quando você rejeita a hipótese nula, diz que possui algumas "evidências" para concluir que a hipótese alternativa pode ser verdadeira.

— Nbro 13/01/19

@ nbro, obrigado, eu adicionei uma pergunta ao meu post original. Você poderia dar uma olhada?

— precisa saber é o seguinte

1

Eu não estou super familiarizado com o teste de hipóteses, em geral. É melhor esperar uma pessoa mais competente para responder às suas perguntas.

— Nbro 13/01/19

Se sua hipótese alternativa é um complemento da hipótese nula, não faz sentido usá-lo. Ninguém usa hipóteses alternativas na prática por esse motivo fora dos livros didáticos.

— Aksakal

"Não falamos em aceitar hipóteses alternativas" - não é verdade para todos os "nós" possíveis. Algumas pessoas falam sobre aceitar a hipótese alternativa, e muitas outras pensam , mesmo que respeitem o tabu contra dizê- la. É um tanto pedante evitar falar em aceitar a hipótese alternativa quando não há dúvida razoável de que ela é verdadeira. Mas, como as estatísticas são tão propensas ao uso indevido, nesse caso, a pediatria é provavelmente uma coisa boa, na medida em que inculca cautela na interpretação dos resultados.

— John Coleman

7

Vou me concentrar em "Se não falamos em aceitar hipóteses alternativas, por que precisamos ter hipóteses alternativas?"

Porque nos ajuda a escolher uma estatística de teste significativa e projetar nosso estudo para ter alto poder - uma grande chance de rejeitar o nulo quando a alternativa for verdadeira. Sem uma alternativa, não temos conceito de poder.

Imagine que temos apenas uma hipótese nula e nenhuma alternativa. Então não há orientação sobre como escolher uma estatística de teste que terá alta potência. Tudo o que podemos dizer é: "Rejeite o nulo sempre que observar uma estatística de teste cujo valor é improvável sob o nulo". Podemos escolher algo arbitrário: podemos desenhar números aleatórios Uniform (0,1) e rejeitar o nulo quando estiverem abaixo de 0,05. Isso acontece sob o nulo "raramente", não mais do que 5% das vezes - mas também é tão raro quando o nulo é falso. Portanto, este é tecnicamente um teste estatístico, mas não tem sentido como evidência a favor ou contra qualquer coisa.

Em vez disso, geralmente temos alguma hipótese alternativa cientificamente plausível ( "Não é uma diferença positiva nos resultados entre os grupos de tratamento e controle da minha experiência"). Gostaríamos de defendê-lo contra potenciais críticos que apresentariam a hipótese nula como advogados do diabo ("Ainda não estou convencido - talvez o seu tratamento realmente dói, ou não tenha nenhum efeito , e qualquer diferença aparente no os dados são devidos apenas à variação da amostra ").

Com essas duas hipóteses em mente, agora podemos configurar um teste poderoso , escolhendo uma estatística de teste cujos valores típicos sob a alternativa sejam improváveis sob nulo. (Uma estatística t positiva de 2 amostras longe de 0 não seria surpreendente se a alternativa for verdadeira, mas surpreendente se o nulo for verdadeiro.) Em seguida, calculamos a distribuição da amostra da estatística de teste sob o nulo, para que possamos calcular os valores de p --- e interpretá-los. Quando observamos uma estatística de teste improvável sob o valor nulo, especialmente se o desenho do estudo, o tamanho da amostra etc. foi escolhido para ter alta potência , isso fornece algumas evidências para a alternativa.

Então, por que não falamos em "aceitar" a hipótese alternativa? Porque mesmo um estudo de alta potência não fornece prova completamente rigorosa de que o nulo está errado. Ainda é um tipo de evidência, mas mais fraca do que alguns outros tipos de evidência.

— civilstat
fonte

7

Historicamente, houve discordância sobre se uma hipótese alternativa era necessária. Deixe-me explicar esse ponto de discordância, considerando as opiniões de Fisher e Neyman, dentro do contexto das estatísticas freqüentistas, e uma resposta bayesiana.

$p$
$\alpha$ $\alpha$

$1 - p (Accept H_{0} | H_{1})$ $1 - p\left(\textrm{Accept $H_0$} \, \middle|\, H_1\right)$ $H_0$

$H_0$
$p (H_{0}) = 1$ $p(H_0) = 1$ $H_0$ $p(\text{data}|\text{not }H_0)$

— inocente
fonte

1

Seu último argumento é excelente, e muitas vezes negligenciado em publicações que baseiam toda a sua argumentação em um único NHST desmotivado.

— Konrad Rudolph

H_{0}

$H_0$

p (d a t a | n o t H 0)

$p(data| not H0)$

@innisfree sob concepção frequentista não, mas provavelmente sob bayesiana.

— Michael

Tentar fazer isso sem a introdução de pelo menos 2 modelos ...

— Innisfree

4

Não tenho 100% de certeza se esse é um requisito formal, mas geralmente a hipótese nula e a hipótese alternativa são: 1) complementares e 2) exaustivas. Ou seja: 1) eles não podem ser ambos verdadeiros ao mesmo tempo; 2) se um não é verdadeiro, o outro deve ser verdadeiro.

$height_{boys} = height_{girls}$ $height_{boys} \ne height_{girls}$

— Karolis Koncevičius
fonte

1

H_{0}

$H_0$

H_{a}

$H_a$

H_{0}

$H_0$

H_{a}

$H_a$

2

H_{0}

$H_0$

H_{1}

$H_1$

1

H_{0}

$H_0$

H_{a}

$H_a$

H_{0}

$H_0$

H_{a}

$H_a$

H_{a}

$H_a$

H_{0}

$H_0$

H_{a}

$H_a$

H_{0}

$H_0$

H_{a}

$H_a$

1

@innisfree pode-se testar duas hipóteses de pontos em algum tipo de estrutura de probabilidade - com certeza. Mas esse procedimento não seria chamado de "teste de hipótese nula" e é impreciso. Ele selecionaria o mais próximo como verdadeiro, mesmo nos casos em que nenhum deles fosse verdadeiro. Além disso, em relação ao poder - pode-se escolher uma hipótese ou tamanho de efeito alternativo ao calcular o poder do teste, mas (na minha opinião) deve esquecê-lo quando o teste estiver sendo realizado. A menos que haja alguma informação prévia que o informe sobre os possíveis efeitos presentes nos dados. Talvez pixels brancos / pretos em uma foto barulhenta.

— Karolis Koncevičius 14/01/19

1

θ = 1

$\theta = 1$

H_{0}

$H_0$

θ \in {0, 1}

$\theta \in \{0, 1\}$

H_{0}

$H_0$

H_{1}

$H_1$

2

Por que precisamos ter hipóteses alternativas?

Em um teste de hipóteses clássico, o único papel matemático desempenhado pela hipótese alternativa é que ela afeta a ordem das evidências por meio da estatística de teste escolhida. A hipótese alternativa é usada para determinar a estatística de teste apropriada para o teste, o que equivale a definir uma classificação ordinal de todos os resultados de dados possíveis, dos mais conducentes à hipótese nula (contra a alternativa declarada) aos menos conducentes às hipóteses nulas. (contra a alternativa indicada). Depois de formar esse ranking ordinal dos possíveis resultados dos dados, a hipótese alternativa não desempenha mais nenhum papel matemático no teste .

$n$ $\mathbf{x} = (x_1,...,x_n)$ $T: \mathbb{R}^n \rightarrow \mathbb{R}$ que mapeia todos os resultados possíveis dos dados em uma escala ordinal que mede se é mais favorável à hipótese nula ou alternativa. (Sem perda de generalidade, assumiremos que valores mais baixos são mais propícios à hipótese nula e valores mais altos são mais propícios à hipótese alternativa. Às vezes dizemos que valores mais altos da estatística de teste são "mais extremos" na medida em que constituem mais extremos evidência da hipótese alternativa.) O valor p do teste é então dado por:

p (x) \equiv p_{T} (x) \equiv P (T (X) ⩾ T (x) | H_{0}) .

$p(\mathbf{x}) \equiv p_T(\mathbf{x}) \equiv \mathbb{P}( T(\mathbf{X}) \geqslant T(\mathbf{x}) | H_0).$

Essa função de valor p determina totalmente as evidências no teste para qualquer vetor de dados. Quando combinado com um nível de significância escolhido, determina o resultado do teste para qualquer vetor de dados. (Nós descrevemos isso para um número fixo de pontos de dados mas isso pode ser facilmente estendido para permitir arbitrários .) É importante observar que o valor de p é afetado pela estatística do teste somente através da escala ordinal que ele induz $n$ $n$ , portanto, se você aplicar uma transformação monotonicamente crescente às estatísticas de teste, isso não fará diferença no teste de hipótese (ou seja, é o mesmo teste). Essa propriedade matemática reflete apenas o fato de que o único objetivo da estatística de teste é induzir uma escala ordinal no espaço de todos os vetores de dados possíveis, para mostrar quais são mais propícios para a alternativa nula.

A hipótese alternativa afeta essa medida somente através da função $T$ , que é escolhida com base nas hipóteses nulas e alternativas declaradas no modelo geral. Portanto, podemos considerar a função estatística de teste como sendo uma função do modelo geral e as duas hipóteses. Por exemplo, para um teste de razão de verossimilhança, a estatística de teste é formada tomando uma razão (ou logaritmo de uma razão) de supremos da função de verossimilhança em intervalos de parâmetros relacionados às hipóteses nulas e alternativas. $T \equiv g (\mathcal{M}, H_0, H_A)$ $\mathcal{M}$

O que isso significa se compararmos testes com diferentes alternativas? Suponha que você tenha um modelo fixo e deseje fazer dois testes de hipótese diferentes comparando a mesma hipótese nula com duas alternativas diferentes e . Nesse caso, você terá duas funções estatísticas de teste diferentes: $\mathcal{M}$ $H_0$ $H_A$ $H_A'$

T = g (M, H_{0}, H_{A}) T^{'} = g (M, H_{0}, H_{A}^{'}),

$T = g (\mathcal{M}, H_0, H_A) \quad \quad \quad \quad \quad T' = g (\mathcal{M}, H_0, H_A'),$

levando às funções de valor p correspondentes:

p (x) = P (T (X) ⩾ T (x) | H_{0}) p^{'} (x) = P (T^{'} (X) ⩾ T^{'} (x) | H_{0}) .

$p(\mathbf{x}) = \mathbb{P}( T(\mathbf{X}) \geqslant T(\mathbf{x}) | H_0) \quad \quad \quad \quad \quad p'(\mathbf{x}) = \mathbb{P}( T'(\mathbf{X}) \geqslant T'(\mathbf{x}) | H_0).$

É importante observar que, se e são transformações monotônicas crescentes uma da outra, as funções de valor e são idênticas, portanto, ambos os testes são o mesmo teste. Se as funções e não são transformações monotônicas crescentes uma da outra, então temos dois testes de hipótese genuinamente diferentes. $T$ $T'$ $p$ $p'$ $T$ $T'$

— Ben - Restabelecer Monica
fonte

2

Eu concordaria com isso, dizendo que o teste é projetado para rejeitar a hipótese nula quando confrontado com resultados extremos, e o papel da hipótese alternativa é apontar em que resultados seriam vistos como extremos se a hipótese nula fosse verdadeira

— Henry

1

A razão pela qual eu não pensaria em aceitar a hipótese alternativa é porque não é isso que estamos testando. O teste de significância de hipótese nula (NHST) calcula a probabilidade de observar dados tão extremos quanto observado (ou mais), considerando que a hipótese nula é verdadeira ou, em outras palavras, o NHST calcula um valor de probabilidade condicionado ao fato de que a hipótese nula é verdadeira , . Portanto, é a probabilidade dos dados assumirem que a hipótese nula é verdadeira. Ele nunca usa ou fornece a probabilidade de uma hipótese (nem nula nem alternativa). Portanto, quando você observa um pequeno valor p, tudo que você sabe é que os dados que você observou parecem improváveis em $P(data|H_0)$ $H_0$ , então você está coletando evidências contra o nulo e a favor de qualquer que seja sua explicação alternativa.

Antes de executar o experimento, você pode decidir sobre um nível de corte ( ) que considere significativo, ou seja, se o valor de p cair abaixo desse nível, você conclui que a evidência contra o nulo é tão esmagadoramente alta que o os dados devem ter se originado de algum outro processo de geração de dados e você rejeita a hipótese nula com base nessa evidência. Se o valor-p estiver acima desse nível, você falha em rejeitar a hipótese nula, pois sua evidência não é substancial o suficiente para acreditar que sua amostra veio formar um processo diferente de geração de dados. $\alpha$

A razão pela qual você formula uma hipótese alternativa é porque provavelmente teve um experimento em mente antes de começar a amostrar. A formulação de uma hipótese alternativa também pode decidir se você usa um teste de uma ou duas caudas e, portanto, fornece mais poder estatístico (no cenário de uma cauda). Mas tecnicamente, para executar o teste, você não precisa formular uma hipótese alternativa, apenas os dados.

— Stefan
fonte

O NHST não calcula ; calcula . A distinção é importante.

P (d a t a | H_{0})

$P(data|H_0)$

P (data as extreme as that observed | H_{0})

$P(\textrm{data as extreme as that observed}|H_0)$

— innisfree

@innisfree Eu concordo e foi exatamente assim que defini os dados na mesma frase.

— Stefan

? Não consigo ver em nenhum lugar onde os dados são definidos (dessa maneira ou de qualquer outra maneira) #

— 1413

E mesmo que fosse, por que fazer isso? Por que redefinir os dados dessa maneira? Eu aconselho a esclarecer as partes do texto em torno de p (dados ..

— innisfree