Existe algum padrão ouro para modelar séries temporais com espaçamento irregular?


45

No campo da economia (eu acho), temos ARIMA e GARCH para séries temporais espaçadas regularmente e Poisson, Hawkes para modelagem de processos pontuais, e quanto a tentativas de modelar séries temporais espaçadas irregularmente (desigualmente) - existem (pelo menos) práticas comuns ?

(Se você tem algum conhecimento neste tópico, também pode expandir o artigo wiki correspondente .)

Edição (sobre valores ausentes e séries temporais com espaçamento irregular):

Responda ao comentário de @Lucas Reis. Se as lacunas entre as medidas ou as variáveis ​​de realização são espaçadas devido (por exemplo) ao processo de Poisson, não há muito espaço para esse tipo de regularização, mas existe um procedimento simples: t(i)é o i-ésimo índice da variável x (i-ésima vez) realização x), em seguida, definir as lacunas entre os tempos de medição como g(i)=t(i)-t(i-1), em seguida, nós discretizar g(i)usando constante c, dg(i)=floor(g(i)/ce criar novas séries de tempo com o número de valores em branco entre as observações de idade a partir de séries de tempo original ie i+1igual à dG (i), mas o problema é que este Esse procedimento pode facilmente produzir séries temporais com número de dados ausentes muito maior que o número de observações, portanto a estimativa razoável dos valores das observações ausentes pode ser impossível e muito grandecexcluir "estrutura de tempo / dependência de tempo etc." do problema analisado (um caso extremo é dado ao considerar c>=max(floor(g(i)/c))que simplesmente colapsamos séries temporais com espaçamento irregular em

Edição 2 (apenas por diversão): imagem que representa valores ausentes em séries temporais com espaçamento irregular ou mesmo no caso de processos pontuais.


Só para esclarecer, quando você diz "espaçamento irregular", você não quer dizer "espaçamento regular, mas com valores ausentes", certo?
Wayne

2
Não :) t(i)- tempo, x[t(i)],x[t(i+1)],x[t(i+2)]...e t(j+1)-t(j)não é constante. Os dados são coletados em um solar distribuído ou assíncrono.
Qbik


2
Que tal interpolar e fazer a análise com os valores interpolados, espaçados regularmente? Alguém sabe quais seriam as implicações desse método?
Lucas Reis

E a primeira modelagem dos tempos dos pontos e, em seguida, dos valores dos pontos, dependendo do tempo deles? Acredito que 'processos pontuais marcados' são o termo.
PeterR

Respostas:


26

Se as observações de um processo estocástico são espaçadas irregularmente, a maneira mais natural de modelar as observações é como observações de tempo discretas de um processo de tempo contínuo.

O que geralmente é necessário para uma especificação de modelo é a distribuição conjunta das observações observadas às vezes , e isso pode, por exemplo, ser dividido em distribuições condicionais de dado . Se o processo for de Markov, essa distribuição condicional depende de não de e depende de e . Se o processo é homogêneo no tempo, a dependência dos pontos no tempo é apenas através da diferença .t 1 < t 2 < < t nX1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

Vimos a partir disso que, se tivermos observações equidistantes (com , por exemplo) de um processo Markov homogêneo no tempo, precisamos especificar apenas uma única distribuição de probabilidade condicional, , para especificar um modelo. Caso contrário, precisamos especificar uma coleção inteira de distribuições de probabilidade condicional indexadas pelas diferenças de tempo das observações para especificar um modelo. O último é, de facto, mais facilmente feito especificando uma família de distribuições de probabilidade condicional de tempo contínuo.titi1=1P1Ptiti1Pt

Uma maneira comum de obter uma especificação de modelo de tempo contínuo é através de uma equação diferencial estocástica (SDE) Um bom lugar para começar a fazer estatísticas para modelos de SDE é Simulação e Inferência para Equações Diferenciais Estocásticas de Stefano Iacus. Pode ser que muitos métodos e resultados sejam descritos para observações equidistantes, mas isso geralmente é apenas conveniente para a apresentação e não essencial para a aplicação. Um obstáculo principal é que a especificação SDE raramente permite uma probabilidade explícita quando você tem observações discretas, mas existem alternativas bem desenvolvidas de equações de estimativa.

dXt=a(Xt)dt+b(Xt)dBt.

Se você deseja ir além dos processos de Markov, os modelos de volatilidade estocástica são como (G) os modelos ARCH tentam modelar uma variação heterogênea (volatilidade). Também se pode considerar equações de atraso como que são análogos de tempo contínuo dos processos AR . ( p )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Eu acho que é justo dizer que a prática comum ao lidar com observações em momentos irregulares é construir um modelo estocástico de tempo contínuo.


1
GARCH não é um processo de volatilidade estocástica. O volume em GARCH é completamente determinado para este período pelas observações dos períodos anteriores.
Aksakal

12

Para séries temporais com espaçamento irregular, é fácil construir um filtro Kalman .

Há um artigo sobre como transferir o ARIMA para o formulário do espaço de estados aqui

E um artigo que compara Kalman a GARCH aqui(1)

(1) Choudhry, Taufiq e Wu, Hao (2008)
Capacidade de previsão do método de filtro GARCH vs Kalman: evidências da beta diária variável no tempo no Reino Unido.
Jornal de Previsão , 27, (8), 670-689. (doi: 10.1002 / for.1096).


Desculpe, eu não tenho acesso ao último artigo, você poderia me ajudar?
Quartz

2
Eu adicionei a citação por isso é fácil de encontrar - há também uma pré-publicação aqui: eprints.soton.ac.uk/147383
bdecaf

O artigo sobre a transferência do ARIMA para o espaço de estado parece ter um link quebrado.
ofey73

9

Quando eu estava procurando uma maneira de medir a quantidade de flutuação nos dados de amostras irregulares, deparei-me com esses dois artigos sobre suavização exponencial para dados irregulares por Cipra [ 1 , 2 ]. Isso se baseia nas técnicas de suavização de Brown, Winters e Holt (veja a entrada na Wikipedia sobre Suavização exponencial ) e em outro método de Wright (consulte o documento para obter referências). Esses métodos não pressupõem muito sobre o processo subjacente e também funcionam para dados que mostram flutuações sazonais.

Não sei se isso conta como um "padrão-ouro". Para meu próprio propósito, decidi usar a suavização exponencial bidirecional (única) seguindo o método de Brown. Tive a ideia de facilitar a leitura do resumo em um artigo do aluno (que não consigo encontrar agora).


7

A análise de séries temporais com amostragem irregular pode ser complicada, pois não há muitas ferramentas disponíveis. Às vezes, a prática é aplicar algoritmos regulares e esperar o melhor. Esta não é necessariamente a melhor abordagem. Outras vezes, as pessoas tentam interpolar os dados nas lacunas. Eu já vi casos em que as lacunas são preenchidas com números aleatórios que têm a mesma distribuição que os dados conhecidos. Um algoritmo especificamente para séries com amostragem irregular é o Periodograma Lomb-Scargle, que fornece um periodograma (pense em espectro de potência) para séries temporais com amostragem desigual. O Lomb-Scargle não requer nenhum "condicionamento de espaço".


3

Se você deseja um modelo de domínio de tempo "local" - ao contrário de estimar funções de correlação ou espectros de potência), diga para detectar e caracterizar pulsos, saltos e similares transitórios - então o algoritmo Bayesian Block pode ser útil. Ele fornece uma representação constante ideal das séries temporais em qualquer modo de dados e com amostragem arbitrária (desigual). Vejo

"Estudos em análise de séries temporais astronômicas. VI. Representações de blocos bayesianos", Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Astrophysical Journal, Volume 764, 167, 26 pp. (2013). http://arxiv.org/abs/1207.5578


2

RJMartin, "Sinais com amostragem irregular: Teorias e Técnicas de Análise", tese de doutorado, UCL, 1998, disponível online. O capítulo 4 trata de modelos auto-regressivos e desenvolve o assunto da perspectiva do tempo contínuo, como outros posts já disseram.


1

A Seção 4.10 de J.Durbin, SJKoopman, Análise de Séries Temporais por Métodos de Espaço de Estado , 2ª edição, 2012, é dedicada à modelagem na circunstância de observações ausentes.


1

Na análise de dados espaciais, na maioria das vezes, os dados são amostrados irregularmente no espaço. Portanto, uma idéia seria ver o que é feito lá e implementar a estimativa de variograma, krigagem etc. para o domínio "tempo" unidimensional. Os variogramas podem ser interessantes mesmo para dados de séries temporais espaçados regularmente, pois possuem propriedades diferentes da função de autocorrelação e são definidos e significativos mesmo para dados não estacionários.

Aqui está um artigo (em espanhol) e aqui outro.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.