Coeficiente de determinação na regressão linear múltipla: Na regressão linear múltipla, o coeficiente de determinação pode ser escrito em termos das correlações pareadas para as variáveis usando a forma quadrática:
R2=rTy,xr−1x,xry,x,
onde é o vetor de correlações entre o vetor de resposta e cada um dos vetores explicativos e é a matriz de correlações entre os vetores explicativos (para mais informações, consulte esta pergunta relacionada ). No caso de uma regressão bivariada, você tem:ry,xrx,x
R2=[rY,X1rY,X2]T[1rX1,X2rX1,X21]−1[rY,X1rY,X2]=11−r2X1,X2[rY,X1rY,X2]T[1−rX1,X2−rX1,X21][rY,X1rY,X2]=11−r2X1,X2(r2Y,X1+r2Y,X2−2rX1,X2rY,X1rY,X2).
Você não especificou as direções das correlações univariadas em sua pergunta; portanto, sem perda de generalidade, indicaremos . Substituindo os valores de e rendimento:D≡sgn(rY,X1)⋅sgn(rY,X2)∈{−1,+1}r2Y,X1=0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
É possível que , pois é possível que as informações combinadas das duas variáveis sejam maiores que a soma de suas partes. Esse fenômeno interessante é chamado de 'aprimoramento' (ver, por exemplo, Lewis e Escobar 1986 ).R2>0.7