Respostas:
A questão essencial é: qual problema você está tentando resolver?
Se você pretende criar um bom modelo para os dados (e mais tarde usar o modelo para teste de hipóteses, previsão ou o que for), precisará considerar todos os padrões existentes. Se houver sazonalidade, inclua padrões sazonais no seu modelo. Se você não fizer isso, o modelo pode não ser adequado; pode gerar resultados de testes de hipóteses não confiáveis, previsões ruins etc.
Agora você diz que deseja determinar (que interpretarei como estimativa) a correlação cruzada entre duas séries. Entendo que a correlação cruzada é apenas a correlação regular estimada para diferentes atrasos versus leads das duas séries. Para a intuição, basta considerar a correlação regular, o que farei daqui em diante. A ideia pode ser transmitida sem problemas da correlação regular para a correlação cruzada.
Se as duas séries temporais fossem bivariadas , a correlação da amostra corresponderia a uma correlação da população. Portanto, você pode ter uma estimativa de pontos significativa, um intervalo de confiança e outras coisas. No entanto, se pelo menos uma das séries temporais não for, definir uma contrapartida da população da correlação da amostra se torna difícil e, subsequentemente, as estimativas são difíceis de interpretar. Então fica mais fácil especificar um modelo para seus dados e começar a fazer perguntas em termos do modelo.
Agora assuma que ambas as séries são bivariadas exceto padrões sazonais em seus meios. Em seguida, você pode removê-las e estimar a correlação das séries com ajuste sazonal (que neste momento deve ser aproximadamente bivariada) Mas esteja ciente de que a correlação que você está obtendo após o ajuste sazonal não é informativa da sua pergunta original: "Qual é a correlação entre as duas séries?" Por exemplo, suas duas séries podem ter exatamente o mesmo padrão sazonal e apenas pequenas variações aleatórias ao seu redor. Portanto, as duas séries são quase as mesmas, e você pensaria intuitivamente que a correlação delas deveria ser positiva e realmente alta (próxima à unidade). Mas a correlação de amostra que você obtém após o ajuste sazonalpode estar em qualquer lugar entre [-1,1], uma vez que os componentes de ruído aleatório (estimado, mas também o verdadeiro subjacente) das duas séries podem ou não estar correlacionados. Assim, você obteria uma resposta para uma pergunta na qual não está realmente interessado; não há garantia de que a resposta esteja próxima do que você está realmente procurando.
Portanto, recomendo que você confie em um modelo totalmente especificado (a menos que ambas as séries temporais sejam bivariadas ) e faça perguntas em termos do modelo. Por outro lado, se você não tem tempo para construir um modelo e precisa de uma resposta rápida (isso pode acontecer), acredito que a estimativa pontual mais relevante da correlação entre as duas séries seria apenas a correlação regular da amostra (embora tem o problema de não ter uma contrapartida significativa na população e seu intervalo de confiança seria difícil de definir, conforme explicado acima).
Se você estiver regredindo duas séries temporais (não relacionadas) com sazonalidade, poderá obter o que é chamado de correlação espúria . Um exemplo disso está disponível aqui
"é importante considerar se existem tendências significativas na série; se ignorarmos uma tendência comum, podemos estar estimando uma regressão espúria, na qual ambos e a variáveis parecem estar correlacionadas devido à influência de um fator omitido, a passagem do tempo "- fonte
A tendência comum pode ser um desvio ou um padrão de sazonalidade. Para evitar correlações espúrias, é fundamental embranquecer seus dados, compensando o efeito de tendência e sazonalidade. Você pode então regredir nos resíduos.
Uma introdução mais formal ao problema está disponível aqui
O link para a "solução mais formal" parece ir para uma página uni genérica. Você poderia atualizá-lo para apontar para o artigo, se ainda estiver disponível?