Séries temporais altamente irregulares


10

Eu tenho dados para a população de vários peixes diferentes, amostrados durante um período de cerca de 5 anos, mas em um padrão muito irregular. Às vezes, há meses entre as amostras, às vezes há várias amostras em um mês. Há também muitas contagens 0

Como lidar com esses dados?

Posso fazer gráficos com bastante facilidade em R, mas os gráficos não são particularmente esclarecedores, porque são muito irregulares.

Em termos de modelagem - com espécies modeladas em função de várias coisas - talvez um modelo misto (também conhecido como modelo multinível).

Todas as referências ou idéias são bem-vindas

Alguns detalhes em resposta a comentários

Existem cerca de 15 espécies.

Estou tentando ter uma idéia de qualquer tendência ou sazonalidade em cada peixe e ver como as espécies se relacionam (meu cliente originalmente queria uma tabela simples de correlações)

O objetivo é descritivo e analítico, não preditivo

Edições adicionais: Encontrei este artigo de K. Rehfield et al., Que sugere o uso de núcleos gaussianos para estimar o ACF para séries temporais altamente irregulares

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


11
Não sou o cara certo para responder à sua pergunta, mas um modelo multinível parece razoável. Alguma dica sobre o tamanho das amostras, quantas espécies existem e como ocorre a contagem zero? (Sobre o último ponto, são as tentativas amostras em amostras aleatórias, ou são tendenciosos, como você só tem a contagem a partir de um concurso de baixo-pesca que provavelmente não irá produzir qualquer catfish?)
Wayne

11
"Lidar com" significa exatamente o quê? Para algumas idéias sobre como lidar com tempos irregulares, pesquise este site em "+ irregular + tempo"
whuber

Você pode esclarecer a amostragem e o objetivo? Por exemplo, isso é captura-recaptura? É uma rede colocada em um fluxo por um determinado período de tempo, sem liberação? Você está tentando estimar tamanhos futuros de amostras ou a população maior da qual uma amostra é retirada? As amostras são de 1 ou vários locais? Não há nada errado com séries temporais irregulares, mas é um pouco difícil entender a conexão entre eventos de amostragem e entre as amostras e alguma variável de destino (por exemplo, uma resposta do modelo). Além disso, o objetivo é preditivo ou descritivo por natureza?
Iterator

2
Por que alguém votou nesta questão? Por que não tentar ajudar a desenvolver uma pergunta ou resposta melhor?
Iterator

2
@ Iterator Porque, mesmo agora, depois de "outras edições", não há uma pergunta clara aqui. O voto negativo (entregue depois que nenhuma resposta foi observada ao meu primeiro comentário) foi colocado para incentivar o OP a fornecer as melhorias necessárias, bem como um sinal do único estado parcialmente formado da questão como ela estava. Não é tarefa de todo leitor (nem dos mods) adivinhar o que se pretende!
whuber

Respostas:


10

Passei bastante tempo criando uma estrutura geral para séries temporais com espaçamento desigual: http://www.eckner.com/research.html

Além disso, escrevi um artigo sobre estimativa de tendências e sazonalidades para séries temporais desigualmente espaçadas.

Espero que você encontre os resultados úteis!


5
Obrigado! Essa análise foi feita há muito tempo e eu não estou mais fazendo isso, mas coisas semelhantes podem surgir novamente; e outros pesquisam muito esses tópicos, para que seu comentário não seja desperdiçado.
Peter Flom - Restabelece Monica

Obrigado pela informação (e, de fato, anos depois, alguém na internet está procurando!), Mas o link ficou inoperante.
11302 Ligado:

2

Não sei se um modelo misto é muito apropriado (usando os pacotes padrão em que a estrutura de efeitos aleatórios é um preditor linear), a menos que você pense que os dados em todos os momentos devem ser trocáveis ​​entre si em algum sentido (nesse caso) os intervalos irregulares não são um problema) - não seria realmente modelar a autocorrelação temporal de uma maneira razoável. É possível que você possa induzir lmer () a fazer algum tipo de autogressão, mas como exatamente você faria isso me escapa agora (eu posso não estar pensando direito). Além disso, não tenho certeza de qual seria a "variável de agrupamento" que induz a autocorrelação no cenário do modelo misto.

Se a autocorrelação temporal é um parâmetro incômodo e você não espera que seja muitogrande, você pode agrupar os dados em épocas que são essencialmente separadas entre si em termos de correlação (por exemplo, separar as séries temporais em pontos em que há meses sem dados) e visualizá-las como réplicas independentes. Você poderia fazer algo como um GEE nesse conjunto de dados modificado, em que o "cluster" é definido por qual época você está, e as entradas da matriz de correlação de trabalho são uma função de quão distantes as observações foram feitas. Se sua função de regressão estiver correta, você ainda obterá estimativas consistentes dos coeficientes de regressão, mesmo que a estrutura de correlação seja especificada incorretamente. Isso também permitiria modelá-lo como dados de contagem usando, por exemplo, o link de log (como normalmente faria na regressão de Poisson). Você também pode criar uma correlação diferencial entre espécies, onde cada ponto no tempo é visto como um vetor multivariado de espécies, conta com alguma associação de deterioração temporal entre os pontos no tempo. Isso exigiria algum pré-processamento para induzir os pacotes GEE padrão a fazer isso.

Ys,Ytvocê,v

cov(Ys,Yt)=fθ(s,t,você,v)

fθ


Obrigado @macro. Eu acho que um modelo misto pode ser bom, porque eles geralmente são usados ​​para dados aninhados no tempo; Não estou tão interessado em modelar a autocorrelação - isto é, é um incômodo. Concordo que o tempo não será linear, mas posso adicionar efeitos do tempo (ainda não tenho certeza de quais, mas posso explorá-lo). Não tenho MPLUS, mas tenho R e SAS.
Peter Flom - Restabelece Monica

11
Só estou dizendo que um modelo misto padrão pode não ser apropriado nessa situação. A interceptação aleatória é inútil se você não acha que os pontos de tempo são intercambiáveis ​​em termos de correlação (isto é, ofereceria apenas uma aproximação dentro do mundo da 'correlação intercambiável' à sua verdadeira estrutura de correlação). A inclusão de inclinações aleatórias no tempo indica que você acha que a trajetória está "indo para algum lugar" ao longo do tempo - já que o enredo não foi muito esclarecedor para você, isso provavelmente não está acontecendo. Admito que você pode enganar o lmer () a fazer algo mais apropriado.
Macro

2
+1 Uma resposta boa e concisa, abordando todos os principais pontos que eu pensei em abordar e muito mais. Em relação aos pacotes em R, uma pesquisa no Google de CRAN, para [regressão temporal de Poisson], apresenta vários pacotes. O surveillancepacote pode ter a funcionalidade desejada. Esse tipo de modelagem não é incomum nos estudos ecológicos, portanto, provavelmente é melhor encontrar um bom pacote nos recantos ecológicos do CRAN.
Iterator
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.