Para fazer um prefácio, tenho um fundo matemático bastante profundo, mas nunca lidei com séries temporais ou modelagem estatística. Então você não precisa ser muito gentil comigo :)
Estou lendo este artigo sobre modelagem do uso de energia em edifícios comerciais, e o autor faz esta afirmação:
[A presença de autocorrelação surge] porque o modelo foi desenvolvido a partir de dados de séries temporais de uso de energia, que são inerentemente autocorrelacionados. Qualquer modelo puramente determinístico para dados de séries temporais terá autocorrelação. A autocorrelação diminui se [mais coeficientes de Fourier] forem incluídos no modelo. No entanto, na maioria dos casos, o modelo de Fourier tem CV baixo. O modelo pode, portanto, ser aceitável para propósitos práticos que não exigem alta precisão.
0.) O que significa "qualquer modelo puramente determinístico para dados de séries temporais terá autocorrelação"? Eu posso entender vagamente o que isso significa - por exemplo, como você esperaria prever o próximo ponto da sua série cronológica se tivesse 0 autocorrelação? Este não é um argumento matemático, com certeza, e é por isso que é 0 :)
1.) Fiquei com a impressão de que a autocorrelação basicamente matou seu modelo, mas pensando nisso, não consigo entender por que esse deveria ser o caso. Então, por que a autocorrelação é uma coisa ruim (ou boa)?
2.) A solução que ouvi ao lidar com autocorrelação é diferenciar as séries temporais. Sem tentar ler a mente do autor, por que alguém não faria diferença se existe uma autocorrelação não negligenciável?
3.) Quais limitações as autocorrelações não negligenciáveis colocam em um modelo? Isso é uma suposição em algum lugar (isto é, resíduos normalmente distribuídos ao modelar com regressão linear simples)?
De qualquer forma, desculpe se estas são perguntas básicas e agradeço desde já por ajudar.