Dessazonalizando os dados da contagem


12

Usei stl () em R para decompor os dados de contagem em componentes de tendência, sazonal e irregular. Os valores de tendência resultantes não são mais números inteiros. Tenho as seguintes perguntas:

  1. Stl () é uma maneira apropriada de dessazonalizar os dados da contagem?
  2. Como a tendência resultante não é mais valorizada entre os intergeradores, posso usar lm () para modelar os componentes da tendência?

Respostas:


8

Não há nenhum problema inerente ao uso de stl () para dessazonalizar os dados da contagem. Um problema a ser observado, no entanto, é que os dados de contagem geralmente apresentam uma variação crescente à medida que a média aumenta. Isso geralmente é visto nos elementos sazonais e aleatórios da decomposição. O uso de stl () nos dados brutos não levará isso em consideração e, portanto, talvez seja melhor levar primeiro o logaritmo (edição - ou raiz quadrada) de seus dados.

Não importa que os valores de tendência não sejam mais números inteiros. Eles podem ser pensados ​​de maneira semelhante ao parâmetro em uma distribuição de Poisson. Embora uma variável distribuída Poisson deva ser um número inteiro, a média não precisa ser.

No entanto, isso não significa necessariamente que você pode usar lm () para modelar o componente de tendência. Existem muitas armadilhas nas tendências de modelagem em séries temporais, pois será muito difícil evitar correlações espúrias. Mais comumente, as pessoas primeiro prejudicam a série e depois modelam a parte residual.


1
Como você determina quantas tendências existem que precisam ser acomodadas e a duração de cada tendência? Você distingue entre mudanças de nível e tendências e, em geral, como prejudica a presença de outliers / inliers?
IrishStat

@IrishStat - sim, esses são todos os pontos positivos e eu não estava tentando resolver o conjunto completo de questões, basta chamar a atenção para os problemas de usar o componente de tendência da saída do stl () de R como a variável de resposta em uma regressão . stl () usa regressão ponderada localmente em sua decomposição, que geralmente fornece resultados sensatos quando se trata de tendências que mudam de direção etc., embora, é claro, tenha limitações em comparação com métodos baseados em modelos, particularmente para previsão.
Peter Ellis
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.