Atualmente, estou trabalhando em um projeto para fazer a previsão de dados de séries temporais (dados mensais). Estou usando R para fazer a previsão. Eu tenho 1 variável dependente (y) e 3 variáveis independentes (x1, x2, x3). A variável y tem 73 observações e as outras 3 variáveis (também 73). De janeiro de 2009 a janeiro de 2015. Verifiquei correlações e valor-p, e é tudo significativo colocá-lo em um modelo. Minha pergunta é: como posso fazer uma boa previsão usando todas as variáveis independentes? Não tenho valores futuros para essas variáveis. Digamos que eu gostaria de prever qual minha variável y em mais de 2 anos (em 2017). Como posso fazer isso?
Eu tentei o seguinte código:
model = arima(y, order(0,2,0), xreg = externaldata)
Posso fazer uma previsão do valor de y em mais de 2 anos com este código?
Eu também tentei um código de regressão:
reg = lm(y ~ x1 + x2 + x3)
Mas como eu dedico um tempo neste código? Como posso prever qual será meu valor y, digamos 2 anos? Eu sou novo em estatísticas e previsões. Fiz algumas leituras e excedi o valor de atraso, mas como posso usar um valor de atraso no modelo para fazer previsões?
Na verdade, minha pergunta geral é como posso prever dados de séries temporais com variáveis externas sem valor futuro?