Eu realmente acho que essa é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que algum método caseiro é uma maneira melhor de fazer análises de séries temporais do que a Box-Jenkins. Espero que minha tentativa de resposta incentive outras pessoas, que têm mais conhecimento sobre séries temporais, a contribuir.
Desde sua introdução, parece que Darlington está defendendo a abordagem de apenas ajustar um modelo de RA por mínimos quadrados. Ou seja, se você deseja ajustar o modelo
à série temporal z t , você pode apenas regredir a série z t na série com lag 1 , lag 2 e assim por diante até lag k , usando uma regressão múltipla comum. Isso é certamente permitido; em R, é ainda uma opção no
zt= α1zt - 1+ ⋯ + αkzt - k+ εt
ztzt12kar
função. Eu testei e tende a dar respostas semelhantes ao método padrão para ajustar um modelo AR em R.
Ele também defende a regressão de em coisas como t ou poderes de t para encontrar tendências. Novamente, isso é absolutamente bom. Muitos livros de séries temporais discutem isso, por exemplo, Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de série temporal pode prosseguir nas seguintes linhas: você encontra uma tendência, remove-a e ajusta um modelo aos resíduos.zttt
Mas parece que ele também está defendendo o ajuste excessivo e, em seguida, usando a redução no erro do quadrado médio entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo:
Sinto que os correlogramas estão obsoletos. Seu objetivo principal era permitir que os trabalhadores adivinhassem quais modelos se encaixariam melhor nos dados, mas a velocidade dos computadores modernos (pelo menos em regressão, se não no ajuste de modelos de séries temporais) permite que um trabalhador simplesmente ajuste vários modelos e veja exatamente como cada um se ajusta conforme medido pelo erro médio quadrático. [A questão da capitalização do acaso não é relevante para essa escolha, pois os dois métodos são igualmente suscetíveis a esse problema.]
Essa não é uma boa ideia, porque o teste de um modelo deve ser o quão bem ele pode prever, não o quão bem ele se encaixa nos dados existentes. Nos três exemplos, ele usa o "erro quadrático médio ajustado da raiz" como critério para a qualidade do ajuste. É claro que o excesso de ajuste de um modelo tornará a estimativa de erro dentro da amostra menor, de modo que sua afirmação de que seus modelos são "melhores" porque eles têm um RMSE menor está errada.
Em poucas palavras, como ele está usando o critério errado para avaliar quão bom é um modelo, ele chega a conclusões erradas sobre regressão versus ARIMA. Aposto que, se ele tivesse testado a capacidade preditiva dos modelos, o ARIMA teria chegado ao topo. Talvez alguém possa tentar se tiver acesso aos livros que ele menciona aqui .
[Suplementar: para saber mais sobre a idéia de regressão, você pode conferir livros antigos de séries temporais que foram escritos antes do ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series , 1973, capítulo 11, tem um capítulo inteiro sobre esse método e comparações com o ARIMA.]