Um colega meu me enviou esse problema aparentemente fazendo rondas na internet:
If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ?
A resposta parece ser 200.
3*6
4*8
5*10
6*12
7*14
8*16
9*18
10*20=200
Quando eu faço uma regressão linear em R:
data <- data.frame(a=c(3,4,5,6,7), b=c(18,32,50,72,98))
lm1 <- lm(b~a, data=data)
new.data <- data.frame(a=c(10,20,30))
predict <- predict(lm1, newdata=new.data, interval='prediction')
Eu recebo:
fit lwr upr
1 154 127.5518 180.4482
2 354 287.0626 420.9374
3 554 444.2602 663.7398
Então, meu modelo linear está prevendo .
Quando plogo os dados, eles parecem lineares ... mas obviamente assumi algo que não está correto.
Estou tentando aprender a melhor forma de usar modelos lineares em R. Qual é a maneira correta de analisar esta série? Onde foi que eu errei?