Bem, há um método ad hoc que eu já usei antes. Não tenho certeza se esse procedimento tem um nome, mas faz sentido intuitivamente.
Suponha que seu objetivo seja ajustar o modelo
Yi=β0+β1Xi+β2Zi+εi
onde os dois preditores - - estão altamente correlacionados. Como você apontou, usá-los no mesmo modelo pode fazer coisas estranhas às estimativas do coeficiente e valores- p . Uma alternativa é ajustar o modeloXi,Zip
Zi=α0+α1Xi+ηi
Em seguida, o resíduo será não correlacionado com X i e pode, de alguma forma, ser considerada como a parte de Z i que não é absorvido pela sua relação linear com X i . Em seguida, você pode prosseguir para ajustar o modeloηiXiZiXi
Yi=θ0+θ1Xi+θ2ηi+νi
que irá capturar todos os efeitos do primeiro modelo (e, de fato, têm exatamente o mesmo como o primeiro modelo), mas os preditores já não são colineares.R2
Editar: O OP solicitou uma explicação de por que os resíduos não possuem, por definição, uma correlação de amostra zero com o preditor quando você omite a interceptação, como eles fazem quando a interceptação é incluída. Como é muito longo para postar nos comentários, fiz uma edição aqui. Essa derivação não é particularmente esclarecedora (infelizmente não consegui apresentar um argumento intuitivo razoável), mas mostra o que o OP solicitou :
Quando a intercepção é omitido na regressão linear simples , β = Σ x i y iβ^=∑xiyi∑x2iei=yi−xi∑xiyi∑x2ixiei
xe¯¯¯¯¯−x¯¯¯e¯¯¯
⋅¯
Primeiro nós temos
xe¯¯¯¯¯=1n(∑xiyi−x2i⋅∑xiyi∑x2i)=xy¯¯¯¯¯(1−∑x2i∑x2i)=0
but
x¯¯¯e¯¯¯=x¯¯¯(y¯¯¯−x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯)=x¯¯¯y¯¯¯−x¯¯¯2⋅xy¯¯¯¯¯x2¯¯¯¯¯
so in order for the ei and xi to have a sample correlation of exactly 0, we need x¯¯¯e¯¯¯ to be 0. That is, we need
y¯¯¯=x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯
which does not hold in general for two arbitrary sets of data x,y.