Na regressão linear, geralmente obtemos múltiplos R e R ao quadrado. Quais são as diferenças entre eles?
Na regressão linear, geralmente obtemos múltiplos R e R ao quadrado. Quais são as diferenças entre eles?
Respostas:
R múltiplo pode realmente ser visto como a correlação entre a resposta e os valores ajustados. Como tal, é sempre positivo. R-quadrado múltiplo é sua versão ao quadrado.
Deixe-me ilustrar usando um pequeno exemplo:
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469
Não há necessidade de se preocupar com "múltiplos" ou não. Essa fórmula sempre se aplica, mesmo em uma configuração Anova. No caso em que há apenas um covariável , então R com o sinal da inclinação é o mesmo que a correlação entre X e a resposta.
Eu simplesmente explico aos meus alunos que:
o múltiplo R é considerado o valor absoluto do coeficiente de correlação (ou o coeficiente de correlação sem o sinal negativo)!
O R-quadrado é simplesmente o quadrado do múltiplo R. Ele pode ser representado como porcentagem da variação causada pela (s) variável (s) independente (s)
É fácil entender o conceito e a diferença dessa maneira.