Problema
Eu tenho dados de séries temporais gerados por uma máquina em dois períodos disjuntos de tempo - aproximadamente um mês em 2016 e outro mês em 2018.
Os especialistas no domínio sugerem a hipótese de que a cada passo , uma variável observada pode ser explicado por outro conjunto de variáveis observadas, .
Como posso testar se esse processo mudou com o tempo? Observe que não estou tentando testar se a distribuição para a variávelmudou ao longo do tempo. Quero testar se a relação entre oareia mudou ao longo do tempo.
Abordagem atual
Suponha que eu ajuste um modelo de série temporal (por exemplo, um Processo Gaussiano) nos dados de 2016 para prever dado como uma maneira de modelar o processo subjacente que gerou .
Os especialistas em domínio sugeriram que talvez possamos tentar usar esse modelo para prever as variáveis s dado o s de 2018 e use os resíduos de alguma forma para inferir que o modelo (representando o processo em 2016) é ou não é o mesmo em 2018. Não sei como continuar depois deste ponto.
O que eu estou considerando
Devo testar se os resíduos de 2016 e 2018 são gerados a partir da mesma distribuição ou executar um teste de adequação usando algo como o teste de Kolmogorov-Smirnov? Minha preocupação com essa abordagem é que os dados fora da amostra de 2018 provavelmente apresentem erros maiores que os dados de treinamento dentro da amostra de 2016, portanto esse teste provavelmente dará origem a falsos positivos. Existe alguma maneira de ajustar / considerar esse efeito?
Devo ajustar dois modelos, um para 2016 e outro para 2018, e usar alguma maneira de testar se esses dois modelos são "iguais" ou "diferentes"? Por exemplo, uma possibilidade é calcular a divergência de KL entre os 2 Processos Gaussianos ajustados respectivamente nos dados de 2016 e 2018. Existem outras sugestões ou problemas com essa abordagem?
Eu vi alguns posts sobre cointegração. Mas eu não entendo completamente esse conceito. Isso é relevante?
Em geral, como alguém pode abordar esse tipo de problema? Tentei pesquisar online, mas talvez devido à falta de precisão da minha consulta (não conheço esta área), não estou obtendo muitos resultados relevantes. Aprecio até dicas / comentários simples sobre o (s) tópico (s) / palavras-chave a serem pesquisadas ou livros / artigos a serem analisados.
Por favor, note que estou procurando abordagens baseadas em princípios (preferencialmente estatísticas) e não métodos baseados em heurísticas. Bons exemplos são as respostas que sugerem o teste de Chow e suas variantes abaixo.