Previsão de dados de séries temporais esparsas não negativas


7

Eu tenho um conjunto de dados de séries temporais (frequência diária) representando as vendas de um produto a um cliente ao longo do tempo. As vendas são representadas da seguinte forma:

[0 0,0 0,0 0,0 0,24,0 0,0 0,0 0,0 0,0 0,0 0,0 0,4,0 0,0 0,0 0,0 0,17,0 0,0 0,0 0,0 0,9,0 0,...]

em que cada número representa as vendas do produto em um dia.

O problema é que os métodos de previsão de séries temporais (ARMA, HoltWinters) funcionam bem para dados "contínuos" e "suaves", mas não estão produzindo bons resultados nesse caso.

Quero fazer uma previsão dessa série, com atenção a 2 pontos: (1) garantia de valores não negativos e (2) dados esparsos / não contínuos. Alguém sabe como abordar esse problema? Quais métodos / técnicas?

Obrigado!


Apenas para enfatizar, se você não precisar de resolução diária em suas previsões, talvez, agregando a semanal, você tenha uma série cronológica mais fácil de prever.
Juan

Respostas:


3

Eu tenho duas idéias aqui, talvez elas sejam úteis.

Ideia 1: Modelo de tempo entre eventos

Você pode pensar em seus dados como sendo gerados por dois processos: o primeiro é uma distribuição com intervalos de tempo e o segundo é uma distribuição com valores de compra. Portanto, para modelar seus dados, você pode criar uma distribuição (gaussiana?) Sobre os valores diferentes de zero em seu conjunto de dados e outra sobre os comprimentos das seqüências de zeros (poisson?).

Ideia 2: modelo de inventário de clientes

Mesmo que os eventos de vendas em seu conjunto de dados sejam escassos, você pode gastar um pouco de tempo para criar um modelo de por que o cliente está fazendo compras quando o faz. Em um modelo possível, o cliente tem um estoque que diminui com o tempo e faz compras quando o estoque ultrapassa um limite mínimo. Você pode usar seus dados de vendas para ajustar a inclinação (para retração linear) ou a taxa (para retração exponencial), bem como o limite.

Isso pode ficar arbitrariamente complexo, já que o cliente nesse modelo pode ter limites ou taxas de encolhimento diferentes em momentos diferentes ... mas, para iniciantes, pode ser uma abordagem útil para entender as coisas.


obrigado pela resposta, @ lmjohns3! De fato, o que tenho em mente hoje é muito semelhante ao que você propôs: (1) modelar o consumo do cliente com base no histórico de compras usando um processo de Poisson; (2) prever esse valor; (3) modelar o comportamento de compra, novamente usando o processo de Poisson. Se você tiver mais alguma sugestão, entre em contato!
Bernardo Aflalo

1

Nesse tipo de dados, as informações vêm de 2 lugares

  1. Intervalo de tempo entre as vendas TEu: intervalo de tempo entre SumaeueEu-1 1 e SumaeueEu
  2. Quantidade de SumaeueEu: YEu

Semelhante a uma resposta anterior , vou sugerir começar verificando o intervalo de tempo quanto a possíveis padrões. O segundo é verificar a relação entre a quantidade de vendasYEu com YEu-1 1 e TEu, TEu-1 1. No caso mais geral, esses 2 devem estar correlacionados. Com base nisso, você pode decidir se deve modelá-los independentemente ou em conjunto. Um modelo comumente usado é o modelo de espaço de estado. A idéia básica aqui é decompor os ts esparsos em subcomponentes que não são escassos e fáceis de modelar.

Um modelo geral pode ser:

TEu=g(TEu-1 1,YEu-1 1)+eEu,

YEu=f(YEu-1 1,TEu)+hEu

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.