Você tem o que é chamado de demanda intermitente , ou seja, uma série temporal de demanda caracterizada por "muitos" zeros. (Se a sua série temporal não for demanda em si, a maior parte do que se segue ainda será aplicada.) Portanto, uma pesquisa na Web por "previsão de demanda intermitente" já seria útil. Teunter e Duncan (2009, JORS) fornecem uma visão geral dos métodos de previsão de demanda intermitentes.
O método padrão de previsão de demandas intermitentes é o método de Croston. Use suavização exponencial em intervalos entre demandas e tamanhos de demanda diferentes de zero separadamente . A previsão de ponto é a razão entre a demanda suavizada diferente de zero e o intervalo entre demandas suavizado. Syntetos e Boylan (2001, IJPE) observam que Croston é um pouco tendencioso e propõe uma modificação, mas isso geralmente não faz muita diferença na prática.
Uma alternativa são os modelos de média móvel autoregressiva inteira (INARMA), que modificam os modelos padrão de séries temporais ARIMA. Maryam Mohammadipour escreveu uma tese sobre isso.
Pessoalmente, tenho grandes dúvidas sobre a utilidade de tal previsão de pontos de expectativa. Uma série temporal de 1 demanda a cada dois períodos de tempo tem uma expectativa de 0,5 ... assim como uma série temporal de 2 demandas a cada quarto período de tempo ... e assim por diante - embora essas sejam, obviamente, cada vez menos Poisson-y . Eu diria que é muito mais útil entender toda a distribuição futura (e preditiva) de demandas. Por isso, aplaudo a sua procura por intervalos de previsão!
α ( n - 2 )y^λ = y^
Shenstone e Hyndman (2005, JoF) observam que não existe um modelo estocástico consistente para o qual o método de Croston seria ideal - todos os modelos candidatos são (1) contínuos, não discretos e (2) podem produzir valores negativos. No entanto, para esses modelos candidatos, Shenstone e Hyndman fornecem intervalos de previsão.
Finalmente, uma palavra de cautela: não use o MAD para avaliar a precisão das previsões de dados de contagem, especialmente para demandas intermitentes. A MAD esperada é minimizada pela mediana da sua distribuição futura, não pela média , e se você escrever que 65% dos seus dados são zeros, a mediana é zero ... o que implica que você provavelmente obterá a MAD mais baixa por um nível plano previsão zero, que é muito tendenciosa e provavelmente inútil. Aqui está uma apresentação que fiz no Simpósio Internacional de Previsão do ano passado sobre esta questão. Ou veja Morlidge (2015, Foresight) .
Peça final de autopromoção desavergonhada: tenho um artigo na IJF (Kolassa, 2016) que analisa a previsão de dados de baixa contagem de volumes (principalmente intermitentes), diferentes medidas de precisão e diferentes métodos de previsão, incluindo vários tipos de modelos de Poisson. Isso pode ser útil para você.