Qual é a hipótese nula para os valores de p individuais em regressão múltipla?

Eu tenho um modelo de regressão linear para uma variável dependente base em duas variáveis independentes, e , então eu tenho uma forma geral de uma equação de regressão $Y$ $X1$ $X2$

$Y = A + B_1 \cdot X_1 + B_2 \cdot X_2 + \epsilon$ ,

onde é a interceptação, é o termo de erro e e são os respectivos coeficientes de e . Realizo uma regressão múltipla com o software (statsmodel em Python) e obtenho coeficientes para o modelo: . O modelo também me fornece valores de para cada coeficiente: , e . Minha pergunta é: Qual é a hipótese nula para esses valores individuais de ? Por exemplo, para obter eu sei que a hipótese nula implica um coeficiente 0 para $A$ $\epsilon$ $B_1$ $B_2$ $X_1$ $X_2$ $A = a, B_1 = b_1, B_2 = b_2$ $p$ $p_a$ $p_1$ $p_2$ $p$ $p_1$ $B_1$ , mas e as outras variáveis? Em outras palavras, se a hipótese nula for , quais são os valores de e para a hipótese nula da qual o valor de é derivado? $Y = A + 0 \cdot X_1 + B_2 \cdot X_2$ $A$ $B_2$ $p$ $B_1$

regression p-value

— tmldwn
fonte

Está faltando um termo de erro no seu modelo.

— Andreas Dzemski

Respostas:

A hipótese nula é que basicamente significa que o valor nulo hipótese não restringe B2 e A. A hipótese alternativa é De certa forma, a hipótese nula no modelo de regressão múltipla é uma hipótese composta. É "feliz" podermos construir uma estatística de teste essencial que não dependa do valor real de B2 e A, para que não soframos penalidades por testar uma hipótese nula composta.

H_{0} : B 1 = 0 and B 2 \in R and A \in R,

$H_0: B1 = 0 \: \text{and} \: B2 \in \mathbb{R} \: \text{and} \: A \in \mathbb{R},$

H_{1} : B 1 \neq 0 and B 2 \in R and A \in R .

$H_1: B1 \neq 0 \: \text{and} \: B2 \in \mathbb{R} \: \text{and} \: A \in \mathbb{R}.$

Em outras palavras, existem muitas distribuições diferentes de que são compatíveis com a hipótese nula . No entanto, todas essas distribuições levam ao mesmo comportamento da estatística de teste usada para testar . $(Y, X1, X2)$ $H_0$ $H_0$

Na minha resposta, não lidei com a distribuição de e assumi implicitamente que se trata de uma variável aleatória normal normal centrada e independente. Se apenas assumirmos algo como , uma conclusão semelhante é válida assintoticamente (sob premissas de regularidade). $\epsilon$

E [ϵ ∣ X 1, X 2] = 0

$E[\epsilon \mid X1, X2] = 0$

— Andreas Dzemski
fonte

Mas, pelo que entendi, a hipótese nula não precisa ser uma distribuição de probabilidade? Se eu tiver valores específicos para os coeficientes, posso gerar uma distribuição de probabilidade adicionando ruído (epsilon) à equação de regressão. Mas se eu não tenho valores específicos para coeficientes, como eu geraria a distribuição de probabilidade nula?

— tmldwn

Uma hipótese nula composta é todo um conjunto de possíveis medidas de probabilidade.

— Andreas Dzemski

Eu editei minha resposta para enfatizar esse ponto.

— Andreas Dzemski

@ tmldwn: Aqui, a distribuição marginal da estatística t realmente não depende de onde estamos no nulo. Se você acha isso difícil de entender, sugiro que você faça cuidadosamente a derivação da distribuição da estatística t. Observe que a estatística t depende do estimador LS. De certa forma, isso ajusta automaticamente a estatística de teste corretamente para a hipótese "verdadeira" no espaço nulo (não precisamos assumir uma posição sobre o que A, B2 é porque não precisamos deles para calcular a estatística de teste).

— Andreas Dzemski

Esta resposta está completamente errada. Como explicado neste documento, há anova para toda a regressão, mas um teste t para cada coeficiente: reliawiki.org/index.php/…

— Josh

Você pode fazer as mesmas suposições para as outras variáveis que o X1. A tabela ANOVA da regressão fornece informações específicas sobre cada significância de variável e a significância geral. No que diz respeito à análise de regressão, a aceitação da hipótese nula implica que o coeficiente da variável é zero, dado um certo nível de significância.

Se você deseja adquirir um aspecto mais intuitivo do problema, pode estudar mais sobre o teste de hipóteses.

— Logicseeker
fonte

Os valores- são o resultado de uma série de testes- . A hipótese nula é que , enquanto a hipótese alternativa (novamente, para cada coeficiente) é $p$ $t$ $B_j=0$ $B_j\ne0$

(veja aqui para obter mais detalhes: http://reliawiki.org/index.php/Multiple_Linear_Regression_Analysis#Test_on_Individual_Regression_Coefficients_.28t__Test.29 )

— Josh
fonte