É válido agregar uma série temporal para torná-la mais significativa?


10

Outra pergunta sobre séries temporais minha.

Eu tenho um conjunto de dados que fornece registros diários de incidentes violentos em um hospital psiquiátrico por três anos. Com a ajuda da minha pergunta anterior, estou brincando com isso e estou um pouco mais feliz com isso agora.

O que tenho agora é que a série diária é muito barulhenta. Ele flutua descontroladamente, para cima e para baixo, de 0 às vezes até 20. Usando gráficos de loess e o pacote de previsão (que eu recomendo para iniciantes como eu), obtive uma linha totalmente plana, com intervalos de confiança maciços da previsão.

No entanto, a agregação semanal ou mensal dos dados faz muito mais sentido. Eles varrem para baixo desde o início da série e depois aumentam novamente no meio. A plotagem de Loess e o pacote de previsão produzem algo que parece muito mais significativo.

Parece um pouco trapaceiro. Estou apenas preferindo as versões agregadas porque elas ficam bonitas sem validade real?

Ou seria melhor calcular uma média móvel e usá-la como base? Receio não entender a teoria por trás de tudo isso o suficiente para ter certeza do que é aceitável

Respostas:


8

Isso depende totalmente da sua série temporal e que efeito você deseja descobrir / provar, etc.

Uma coisa importante aqui é que tipo de períodos você tem em seus dados. Faça um espectro de seus dados e veja quais frequências são comuns em seus dados.

De qualquer forma, você não está mentindo quando decide exibir valores agregados. Quando você está procurando efeitos que ocorrem durante semanas (como mais violência no verão quando faz calor), é a coisa certa a fazer.

Talvez você também possa dar uma olhada na Hilbert Huang Transform. Isso fornecerá funções de modo intrínseco que são muito úteis para análises visuais.


12

É muito comum na previsão agregar dados para aumentar a relação sinal / ruído. Existem vários trabalhos sobre o efeito da agregação temporal na precisão das previsões em economia, por exemplo. O que você provavelmente está vendo nos dados diários é um sinal fraco que está sendo inundado pelo ruído, enquanto os dados semanais e mensais estão mostrando um sinal mais forte e mais visível.

Se você deseja usar a agregação temporal depende inteiramente de qual é seu objetivo. Se você precisar de previsões de incidentes diários, a agregação não será muito útil. Se você estiver interessado em explorar os efeitos de várias covariáveis ​​na frequência de incidência e todos os seus dados estiverem disponíveis diariamente, provavelmente usaria os dados diários, pois fornecerão um tamanho de amostra maior e provavelmente permitirão detectar os efeitos mais facilmente.

Como você está usando o pacote de previsão, presumivelmente você está interessado em previsão de séries temporais. Então, você precisa de previsões diárias, semanais ou mensais? A resposta determinará se a agregação é apropriada para você.


1

O problema (dilema) que você enfrenta parece ser o de selecionar um intervalo de amostragem ideal (ou bom) para revisar suas previsões. Para começar, consulte o texto do link do famoso livro de Brown, que também se qualificaria como uma boa referência. Tudo se resume a "equilibrar o risco de não perceber uma mudança rapidamente com a variabilidade inerente dos dados e o custo de revisar os planos com frequência". Se você não está preparado para revisar sua previsão (e as decisões que a motivaram) diariamente, não precisa realmente usar os dados diários (mais ruidosos). Um ponto importante, muitas vezes perdido na literatura de previsão contemporânea, é que as previsões são necessárias apenas para ajudar na tomada de decisão (a menos que alguém também saiba como tirar sarro delas).

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.