Mínimos Quadrados Ordinários (OLS)
Os mínimos quadrados ordinários (OLS) são o cavalo de batalha das estatísticas. Ele fornece uma maneira de obter resultados complicados e explicar o comportamento (como tendências) usando linearidade. A aplicação mais simples do OLS é ajustar uma linha.
Residuals
Os resíduos são os erros observáveis dos coeficientes estimados. Em certo sentido, os resíduos são estimativas dos erros.
Vamos explicar as coisas usando o R
código:
Primeiro, ajuste uma linha menos quadrada comum de conjuntos de dados de diamante na UsingR
biblioteca:
library(UsingR)
data("diamond")
y <- diamond$price
x <- diamond$carat
n <- length(y)
olsline <- lm(y ~ x)
plot(x, y,
main ="Odinary Least square line",
xlab = "Mass (carats)",
ylab = "Price (SIN $)",
bg = "lightblue",
col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)
Agora, vamos calcular o resíduo, isto é, a soma dos quadrados residuais: R
você pode facilmente calcular o resíduo como resid(olsline)
, para visualização, vamos calculá-lo manualmente:
# The residuals from R method
e <- resid(olsline)
## Obtain the residuals manually, get the predicated Ys first
yhat <- predict(olsline)
# The residuals are y -yhat, Let's check by comparing this with R's build in resid function
ce <- y - yhat
max(abs(e-ce))
## Let's do it again hard coding the calculation of Yhat
max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x)))
# Residuals arethe signed length of the red lines
plot(diamond$carat, diamond$price,
main ="Residuals sum of (actual Y - predicted Y)^2",
xlab = "Mass (carats)",
ylab = "Price (SIN $)",
bg = "lightblue",
col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)
for (i in 1 : n)
lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Espero que esta visualização esclareça suas dúvidas entre RSS e OLS