Sou formado em administração e economia e atualmente estuda mestrado em engenharia de dados. Enquanto estudava regressão linear (LR) e análise de séries temporais (TS), uma pergunta surgiu em minha mente. Por que criar um método totalmente novo, isto é, séries temporais (ARIMA), em vez de usar regressão linear múltipla e adicionar variáveis atrasadas (com a ordem dos atrasos determinada usando ACF e PACF)? Então, o professor sugeriu que eu escrevesse um pequeno ensaio sobre o assunto. Como não procurava ajuda de mãos vazias, fiz minha pesquisa sobre o assunto.
Eu já sabia que, ao usar LR, se as suposições de Gauss-Markov forem violadas, a regressão OLS está incorreta e isso acontece ao usar dados de séries temporais (autocorrelação, etc.). (outra questão sobre isso, uma suposição do GM é que as variáveis independentes devem ser normalmente distribuídas? ou apenas a variável dependente condicional às independentes?)
Também sei que, ao usar uma regressão de retardo distribuído, que é o que acho que estou propondo aqui, e usar o OLS para estimar parâmetros, a multicolinearidade entre variáveis pode (obviamente) surgir, portanto as estimativas estariam erradas.
Em um post semelhante sobre TS e LR aqui, @IrishStat disse:
... um modelo de regressão é um caso particular de um modelo de função de transferência também conhecido como modelo de regressão dinâmica ou modelo XARMAX. O ponto de destaque é que a identificação do modelo em séries temporais, ou seja, as diferenças apropriadas, as defasagens apropriadas dos X's, a estrutura ARIMA apropriada, a identificação apropriada de estruturas determinísticas não especificadas, como pulsos, turnos de nível, tendências da hora local, pulsos sazonais e incorporação mudanças nos parâmetros ou variação de erro devem ser consideradas.
(Também li seu artigo na Autobox sobre Box Jenkins vs LR.) Mas isso ainda não resolve minha pergunta (ou pelo menos não esclarece as diferentes mecânicas de RL e TS para mim).
É óbvio que, mesmo com variáveis atrasadas, surgem problemas de OLS e isso não é eficiente nem correto, mas ao usar a máxima probabilidade, esses problemas persistem? Eu li que o ARIMA é estimado através da máxima probabilidade, portanto, se o LR com defasagens for estimado com ML em vez de OLS, ele produzirá os coeficientes "corretos" (vamos supor que incluamos termos de erro defasados também, como um MA de ordem q)
Em suma, o problema é OLS? O problema foi resolvido com a aplicação do ML?