As estimativas dos coeficientes de regressão não estão correlacionadas?

Considere uma regressão simples (normalidade não assumida): onde está com média e desvio padrão . São os menos Estimativas quadrados de e uncorrelated?

Y_{i} = a + b X_{i} + e_{i},

$Y_i = a + b X_i + e_i,$

e_{i}

$e_i$

0

$0$

σ

$\sigma$

a

$a$

b

$b$

regression correlation estimation

— arnab
fonte

O que você acha? en.wikipedia.org/wiki/Ordinary_least_squares , seção "Propriedades finitas da amostra". Esta pergunta foi respondida várias vezes neste site.

— mpiktas

Essa é uma consideração importante ao projetar experimentos, nos quais pode ser desejável não ter (ou muito pouca) correlação entre as estimativas e . Essa falta de correlação pode ser alcançada controlando os valores do . $\hat a$ $\hat b$ $X_i$

Para analisar os efeitos do nas estimativas, os valores (que são vetores de linhas de comprimento ) são montados verticalmente em uma matriz , a matriz de design, tendo tantas linhas quanto dados e (obviamente ) duas colunas. O correspondente é montado em um vetor longo (coluna) . Nesses termos, escrevendo para os coeficientes reunidos, o modelo é $X_i$ $(1,X_i)$ $2$ $X$ $Y_i$ $y$ $\beta = (a,b)^\prime$

E (Y) = X \cdot β

$\mathbb{E}(Y) = X \cdot \beta$

Os (geralmente) são assumidos como variáveis aleatórias independentes cujas variações são constantes para alguns desconhecidos . As observações dependentes são consideradas uma realização da variável aleatória com valor vetorial . $Y_i$ $\sigma^2$ $\sigma \gt 0$ $y$ $Y$

A solução OLS é

\hat{β} = {(X^{'} X)}^{- 1} X^{'} y,

$\hat\beta = \left(X^\prime X\right)^{-1} X^\prime y,$

assumindo que esta matriz inversa existe. Assim, usando propriedades básicas de multiplicação e covariância de matrizes,

Cov (\hat{β}) = Cov ({(X^{'} X)}^{- 1} X^{'} Y) = ({(X^{'} X)}^{- 1} X^{'} σ^{2} X {(X^{'} X)}^{- 1'}) = σ^{2} {(X^{'} X)}^{- 1} .

$\text{Cov}(\hat\beta) = \text{Cov}\left(\left(X^\prime X\right)^{-1} X^\prime Y\right) = \left(\left(X^\prime X\right)^{-1} X^\prime\sigma^2 X \left( X^\prime X \right)^{-1\prime} \right) = \sigma^2 \left(X^\prime X\right)^{-1}.$

A matriz possui apenas duas linhas e duas colunas, correspondentes aos parâmetros do modelo . A correlação de com é proporcional aos elementos fora da diagonal de que pela regra de Cramer são proporcionais ao produto do ponto das duas colunas de . Como uma das colunas é composta por todos os s, cujo produto escalar com a outra coluna (consistindo no ) é sua soma, encontramos $\left(X^\prime X\right)^{-1}$ $(a,b)$ $\hat a$ $\hat b$ $(X^\prime X)^{-1},$ $X$ $1$ $X_i$

$\hat a$ e não são correlacionados se e somente a soma (ou equivalentemente a média) do for zero. $\hat b$ $X_i$

Esta condição de ortogonalidade frequentemente é alcançada por recentragem o (subtraindo-se a sua média de cada). Embora isso não altere a inclinação estimada , altera a interceptação estimada . Se isso é importante ou não, depende da aplicação. $X_i$ $\hat b$ $\hat a$

Esta análise se aplica à regressão múltipla: a matriz de projeto terá colunas para variáveis independentes (uma coluna adicional consiste em s) e será um vetor de comprimento , mas, caso contrário, tudo passa como antes. $p+1$ $p$ $1$ $\beta$ $p+1$

Na linguagem convencional, duas colunas de são chamadas ortogonais quando seu produto escalar é zero. Quando uma coluna de (digamos a coluna ) é ortogonal a todas as outras colunas, é um fato algébrico facilmente demonstrado que todas as entradas fora da diagonal na linha coluna de são zero (ou seja, os componentes e para todos os são zero). Consequentemente, $X$ $X$ $i$ $i$ $i$ $(X^\prime X)^{-1}$ $ij$ $ji$ $j\ne i$

Duas estimativas de coeficiente de regressão múltipla e não são correlacionadas sempre que uma (ou ambas) das colunas correspondentes da matriz de design são ortogonais a todas as outras colunas. $\hat\beta_i$ $\hat\beta_j$

Muitos projetos experimentais padrão consistem em escolher valores das variáveis independentes para tornar as colunas ortogonais. Isso "separa" as estimativas resultantes, garantindo - antes que qualquer dado seja coletado! - que as estimativas não serão correlacionadas. (Quando as respostas têm distribuições normais, isso implica que as estimativas serão independentes, o que simplifica bastante sua interpretação.)

— whuber
fonte

X^{'} X

$X'X$

(X^{'} X)^{- 1}

$(X'X)^{-1}$

@Heisenberg Esse é um bom ponto. Eu não estava claro sobre isso. Não há ambiguidade no caso de duas colunas, mas preciso pensar em como melhorar a apresentação para o caso de mais colunas.

— whuber

@Heisenberg Sou grato por sua observação perceptiva: isso me permitiu corrigir um erro substancial na discussão do caso de regressão múltipla.

— whuber