Estou interessado no significado geométrico da correlação múltipla e no coeficiente de determinação na regressão ou em notação vetorial,R 2 y i = β 1 + β 2 x 2 , i + ⋯ + β k x k , i + ϵ i
Aqui a matriz de design possui linhas colunas, das quais a primeira é , um vetor 1s que corresponde à interceptação . n k x 1 = 1 n β 1
A geometria é mais interessante no espaço sujeito dimensional em vez de no espaço variável dimensional. Defina a matriz do chapéu:k
Esta é uma projeção ortogonal no espaço da coluna de , ou seja, o plano através da origem estendida pelos vetores que representam cada variável , sendo o primeiro . Então projeta o vetor de respostas observadas em sua "sombra" no plano, o vetor de valores ajustados , e se Ao longo do caminho da projeção, vemos o vetor de resíduos forma o terceiro lado de um triângulo. Isso deve nos fornecer duas rotas para uma interpretação geométrica dex i 1 n H y y = He = y - y R 2:
- O quadrado do coeficiente de correlação múltipla, , que é definido como a correlação entre e . Isso aparecerá geometricamente como o cosseno de um ângulo.
- Em termos de comprimentos de vetores: por exemplo .
Eu ficaria encantado em ver um breve relato que explica:
- Os detalhes mais finos de (1) e (2),
- Por que (1) e (2) são equivalentes,
- Resumidamente, como o insight geométrico nos permite visualizar as propriedades básicas de , por exemplo, por que ele chega a 1 quando a variação de ruído chega a 0. (Afinal, se não podemos intuir a partir de nossa visualização, não passa de um Bonita foto.)
Compreendo que isso seja mais direto se as variáveis forem centralizadas primeiro, o que remove a interceptação da pergunta. No entanto, na maioria das contas de livros didáticos que apresentam regressão múltipla, a matriz de design é a que eu expus. É claro que é bom se uma exposição se aprofundar no espaço ocupado pelas variáveis centralizadas, mas, para obter uma visão da álgebra linear do livro, seria muito útil relacionar isso de volta ao que está acontecendo geometricamente na situação não centralizada. Uma resposta realmente perspicaz pode explicar o que exatamente está se dividindo geometricamente quando o termo de interceptação é descartado - ou seja, quando o vetoré removido do conjunto de abrangência. Eu não acho que esse último ponto possa ser tratado considerando apenas as variáveis centralizadas.