Eu tenho um conjunto de dados de séries temporais multivariadas, incluindo variáveis biológicas e ambientais em interação (além de possivelmente algumas variáveis exógenas). Além da sazonalidade, não há uma clara tendência de longo prazo nos dados. Meu objetivo é ver quais variáveis estão relacionadas entre si. A previsão não é realmente procurada.
Sendo novo na análise de séries temporais, li várias referências. Até onde eu entendi, o modelo Vector Autoregressive (VAR) seria apropriado, mas não me sinto confortável com a sazonalidade e com a maioria dos exemplos que encontrei no campo da economia (como na análise de séries temporais ...) sem sazonalidade.
O que devo fazer com meus dados sazonais? Eu considerei dessazonalizá-los - por exemplo, em R, usaria decompose
e depois usaria os $trend + $rand
valores para obter um sinal que parece bem estacionário (conforme julgado acf
). Os resultados do modelo VAR estão me confundindo (um modelo de 1 lag é selecionado enquanto eu esperaria intuitivamente mais, e apenas os coeficientes de regressão automática - e não de regressão com outras variáveis atrasadas - são significativos). Estou fazendo algo errado ou devo concluir que minhas variáveis não são (linearmente) relacionadas / que meu modelo não é o bom (questão subsidiária: existe um equivalente não linear para VAR?).
[Como alternativa, li que provavelmente poderia usar variáveis sazonais fictícias, embora não consiga descobrir exatamente como implementá-lo].
As sugestões passo a passo seriam muito apreciadas, pois os detalhes para usuários experientes podem ser realmente informativos para mim (e trechos de código R ou links para exemplos concretos são muito bem-vindos, é claro).