As respostas oferecidas estão me dando algumas idéias sobre o que está acontecendo aqui. Eu acredito que pode ter havido alguns erros cometidos por acidente. Veja se a seguinte história faz sentido: Para começar, acho que provavelmente existe uma forte relação entre X e Y nos dados (aqui estão alguns códigos e um gráfico):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Mas, por engano, Y foi previsto apenas a partir da média. Além disso, os resíduos do modelo médio único são plotados contra X, embora o que se pretendesse fosse plotar contra os valores ajustados (código e plotagem):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Podemos corrigir isso ajustando o modelo apropriado e plotando os resíduos a partir dele (código e plotagem):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Parece apenas o tipo de brincadeira que eu fiz quando estava começando.