Suponha que eu tenha um pouco mais de 20.000 séries temporais mensais que vão de jan'05 a dez'11. Cada um deles representa dados de vendas globais para um produto diferente. E se, em vez de calcular previsões para cada um deles, eu quisesse focar apenas em um pequeno número de produtos que "realmente importam"?
Eu poderia classificar esses produtos pela receita anual total e reduzir a lista usando o clássico Pareto. Ainda me parece que, embora eles não contribuam muito para o resultado final, alguns produtos são tão fáceis de prever que deixá-los de fora seria um julgamento ruim. Um produto que vendeu US $ 50 a cada mês nos últimos 10 anos pode não parecer muito, mas requer tão pouco esforço para gerar previsões sobre vendas futuras que eu também o faria.
Então, digamos que divido meus produtos em quatro categorias: alta receita / fácil de prever - baixa receita / fácil de prever - alta receita / difícil de prever - baixa receita / difícil de prever.
Eu acho que seria razoável deixar para trás apenas as séries temporais pertencentes ao quarto grupo. Mas como exatamente posso avaliar a "previsibilidade"?
O coeficiente de variação parece ser um bom ponto de partida (também me lembro de ter visto algum artigo sobre isso há algum tempo). Mas e se minhas séries temporais exibirem sazonalidade / mudanças de nível / efeitos de calendário / tendências fortes?
Eu imaginaria que deveria basear minha avaliação apenas na variabilidade do componente aleatório e não no dos dados "brutos". Ou eu estou esquecendo de alguma coisa?
Alguém já encontrou um problema semelhante antes? Como vocês iriam fazer isso?
Como sempre, qualquer ajuda é muito apreciada!