Estou usando uma série temporal diária de dados de vendas que contém cerca de 2 anos de pontos de dados diários. Com base em alguns dos tutoriais / exemplos on-line, tentei identificar a sazonalidade nos dados. Parece haver periodicidade / sazonalidade semanal, mensal e provavelmente anual.
Por exemplo, existem dias de pagamento, particularmente no primeiro efeito do dia de pagamento do mês, que dura alguns dias durante a semana. Existem também alguns efeitos específicos de férias, claramente identificáveis, observando as observações.
Equipado com algumas dessas observações, tentei o seguinte:
ARIMA (com
Arima
eauto.arima
do pacote de previsão R), usando regressor (e outros valores padrão necessários na função). O regressor que criei é basicamente uma matriz de valores 0/1:- Variáveis de 11 meses (n-1)
- 12 variáveis de férias
- Não foi possível descobrir a parte do dia do pagamento ... já que é um efeito pouco mais complicado do que eu pensava. O efeito do dia de pagamento funciona de maneira diferente, dependendo do dia da semana do 1º do mês.
Eu usei 7 (ou seja, frequência semanal) para modelar as séries temporais. Eu tentei o teste - prevendo 7 dias por vez. Os resultados são razoáveis: a precisão média para uma previsão de 11 semanas chega ao RMSE médio semanal de 5%.
Modelo TBATS (do pacote R-forecast) - usando sazonalidade múltipla (7, 30.4375, 365.25) e obviamente nenhum regressor. A precisão é surpreendentemente melhor que o modelo ARIMA na RMSE média semanal de 3,5%.
Nesse caso, o modelo sem erros ARMA apresenta um desempenho um pouco melhor. Agora, se eu aplicar os coeficientes apenas aos efeitos de férias do modelo ARIMA descrito em # 1, aos resultados do modelo TBATS, o RMSE médio semanal aumenta para 2,95%
Agora, sem ter muita experiência ou conhecimento sobre as teorias subjacentes desses modelos, estou em um dilema se essa abordagem TBATS é válida. Embora esteja melhorando significativamente o RMSE no teste de 11 semanas, estou me perguntando se ele pode sustentar essa precisão no futuro. Ou mesmo se a aplicação de efeitos Holiday do ARIMA ao resultado TBATS for justificável. Qualquer opinião de qualquer / todos os colaboradores será muito apreciada.
Nota: Faça "Salvar link como" para baixar o arquivo.