As três fórmulas a seguir são bem conhecidas, elas são encontradas em muitos livros sobre regressão linear. Não é difícil derivá-los.
β1=rYX1−rYX2rX1X21−r2X1X2√
β2=rYX2−rYX1rX1X21−r2X1X2√
R2=r2YX1+r2YX2−2rYX1rYX2rX1X21−r2X1X2√
Se você substituir os dois betas em sua equação
, obterá a fórmula acima para o quadrado R.R2=rYX1β1+rYX2β2
Aqui está um "insight" geométrico. Abaixo estão duas imagens mostrando a regressão de por e . Esse tipo de representação é conhecido como variáveis como vetores no espaço do assunto ( leia sobre o que se trata). As figuras são desenhadas depois que todas as três variáveis foram centralizadas, e assim (1) o comprimento de cada vetor = st. desvio da respectiva variável e (2) ângulo (seu cosseno) entre cada dois vetores = correlação entre as respectivas variáveis.YX1X2
Y^ é a previsão de regressão (projeção ortogonal de no "plano X"); é o termo do erro; , coeficiente de correlação múltipla.Yecos∠YY^=|Y^|/|Y|
A figura da esquerda mostra as coordenadas inclinadas de nas variáveis e . Sabemos que essas coordenadas relacionam os coeficientes de regressão. Nomeadamente, as coordenadas são: e .Y^X1X2b1|X1|=b1σX1b2|X2|=b2σX2
E a imagem à direita mostra as coordenadas perpendiculares correspondentes . Sabemos que essas coordenadas relacionam os coeficientes de correlação de ordem zero (estes são cossenos de projeções ortogonais). Se for a correlação entre e e for a correlação entre e
, a coordenada será . Da mesma forma para a outra coordenada, .r1YX1r∗1Y^X1r1|Y|=r1σY=r∗1|Y^|=r∗1σY^r2|Y|=r2σY=r∗2|Y^|=r∗2σY^
Até agora, havia explicações gerais da representação vetorial de regressão linear. Agora, voltamos à tarefa para mostrar como ela pode levar a .R2=r1β1+r2β2
Antes de tudo, lembre-se de que, na pergunta deles, @Corone apresentou a condição de que a expressão é verdadeira quando todas as três variáveis são padronizadas , ou seja, não apenas centralizadas, mas também dimensionadas para a variação 1. Então (isto é, implica são as "partes de trabalho" dos vetores), temos coordenadas iguais a: ; ; ; ; bem como. Redesenhe, nessas condições, apenas o "plano X" das figuras acima:|X1|=|X2|=|Y|=1b1|X1|=β1b2|X2|=β2r1|Y|=r1r2|Y|=r2R=|Y^|/|Y|=|Y^|
No quadro, que tem um par de coordenadas perpendiculares e um par de coordenadas de inclinação, do mesmo vector de comprimento . Existe uma regra geral para obter coordenadas perpendiculares a partir das inclinadas (ou anteriores): , onde é matriz de coordenadas perpendiculares; é a mesma matriz de tamanho dos enviesados; e são a matriz simétrica de ângulos (cossenos) entre os eixos não-ortogonais.Y^RP=SCPpoints X axes
SCaxes X axes
X1 e são os eixos no nosso caso, com sendo o cosseno entre eles. Portanto, e .X2r12r1=β1+β2r12r2=β1r12+β2
Substitua esses s expressos por s na declaração de @ Corone e você obterá que , - o que é verdade , porque é exatamente como uma diagonal de um paralelogramo (pintada na figura) é expressa através de seus lados adjacentes (quantidade sendo o produto escalar).β R 2 = R 1 β 1 + R 2 β 2 R 2 = β 2 1 + β 2 2 + 2 β 1 β 2 R 12 β 1 β 2 r 12rβR2=r1β1+r2β2R2=β21+β22+2β1β2r12 β1β2r12
O mesmo se aplica a qualquer número de preditores X. Infelizmente, é impossível desenhar imagens semelhantes com muitos preditores.