Uma maneira realmente boa de encontrar periodicidade em qualquer série regular de dados é inspecionar seu espectro de potência após remover qualquer tendência geral . (Isso se presta bem à triagem automatizada quando a energia total é normalizada para um valor padrão, como a unidade.) A remoção preliminar de tendências (e a diferenciação opcional para remover a correlação serial) é essencial para evitar períodos de confusão com outros comportamentos.
O espectro de potência é a transformada discreta de Fourier da função de autocovariância de uma versão suavizada da série original. Se você considerar as séries temporais como amostra de uma forma de onda física, poderá estimar quanto da energia total da onda é transportada dentro de cada frequência. O espectro de potência (ou periodograma ) representa a potência versus frequência. Os padrões cíclicos (isto é, padrões repetitivos ou sazonais) aparecerão como grandes picos localizados em suas frequências.
Como exemplo, considere esta série temporal (simulada) de resíduos de uma medição diária realizada por um ano (365 valores).
0
Aqui está outro gráfico dos mesmos dados, desenhado para nos ajudar a ver possíveis padrões periódicos.
Se você parecer realmente duro, poderá discernir um padrão ruidoso, mas repetitivo, que ocorre de 11 a 12 vezes. As sequências longas de valores acima de zero e abaixo de zero sugerem pelo menos alguma autocorrelação positiva, mostrando que esta série não é completamente aleatória.
Aqui está o periodograma, mostrado para frequências de até 91 (um quarto da duração total da série). Foi construído com uma janela Welch e normalizado para a área da unidade (para todo o periodograma, não apenas a parte mostrada aqui).
O poder parece "ruído branco" (pequenas flutuações aleatórias) mais dois picos proeminentes. Eles são difíceis de perder, não são? O maior ocorre em um período de 12 e o menor em um período de 52. Esse método detectou um ciclo mensal e um ciclo semanal nesses dados. Isso é realmente tudo o que existe. Para automatizar a detecção de ciclos ("sazonalidade"), basta digitalizar o periodograma (que é uma lista de valores) em busca de máximos locais relativamente grandes.
É hora de revelar como esses dados foram criados.
Os valores são gerados a partir de uma soma de duas ondas senoidais, uma com frequência 12 (de amplitude ao quadrado 3/4) e outra com frequência 52 (de amplitude ao quadrado 1/4). Estes são os picos detectados no periodograma. Sua soma é mostrada como a curva preta grossa. Iid O ruído normal de variação 2 foi então adicionado, como mostrado pelas barras cinza claro que se estendem da curva preta aos pontos vermelhos. Esse ruído introduziu as manobras de baixo nível na parte inferior do periodograma, que de outra forma seriam apenas um zero. Totalmente dois terços da variação total dos valores são não periódicos e aleatórios, o que é muito barulhento: é por isso que é tão difícil perceber a periodicidade apenas olhando para os pontos. No entanto (em parte porque há muitos dados), é fácil encontrar as frequências com o periodograma e o resultado é claro.
Instruções e bons conselhos para calcular periodogramas aparecem no site de Receitas Numéricas : procure a seção "estimativa do espectro de potência usando a FFT". R
possui código para estimativa do periodograma . Essas ilustrações foram criadas no Mathematica 8; o periodograma foi calculado com sua função "Fourier".