A questão aqui é chegar a uma equação que analisa os dados observados em sinal e ruído. Se seus dados forem simples, sua abordagem de regressão poderá funcionar. Deve-se tomar cuidado para entender algumas das suposições que eles estão fazendo com o Profeta. Você deve entender melhor o que o Profeta faz, pois ele não se encaixa apenas em um modelo simples, mas tenta adicionar alguma estrutura.
Por exemplo, algumas reflexões que fiz depois de ler sua introdução bem escrita podem ajudá-lo em sua avaliação. Peço desculpas antecipadamente se não entendi a abordagem deles e gostaria de ser corrigido.
1) O exemplo principal deles tem dois pontos de ruptura na tendência, mas eles capturaram apenas o mais óbvio.
2) Eles ignoram toda e qualquer estrutura ARIMA que reflete séries estocásticas omitidas ou o valor de usar valores históricos de Y para orientar a previsão.
3) Eles ignoram qualquer dinâmica possível (efeitos de lead e lag) de séries estocásticas e determinísticas sugeridas pelo usuário. Os efeitos de regressão causal do Profeta são simplesmente contemporâneos.
4) Não é feita nenhuma tentativa para identificar mudanças de nível / passo nas séries ou pulsos sazonais, por exemplo, uma alteração no EFEITO DE SEGUNDA-SE na metade do tempo devido a algum evento externo desconhecido. O Profeta assume "crescimento linear simples" em vez de validá-lo examinando possibilidades alternativas. Para um possível exemplo disso, consulte Previsão de pedidos recorrentes para um negócio de assinaturas on-line usando o Facebook Prophet e R
5) Sines e Cosines são uma maneira opaca de lidar com a sazonalidade, enquanto efeitos sazonais como dia da semana, dia do mês, semana do mês, mês do ano são muito mais eficaz / informativo ao lidar com efeitos antropogênicos (lidar com seres humanos!).
Sugerir frequências de 365,25 para padrões anuais faz pouco sentido, porque não realizamos a mesma ação no mesmo dia que fizemos no ano passado, enquanto a atividade mensal é muito mais persistente, mas o Profeta parece não oferecer os 11 indicadores mensais opção. As frequências semanais de 52 fazem pouco sentido, porque não temos 52 semanas em cada ano.
6) Nenhuma tentativa é feita para validar os processos de erro sendo gaussianos, de modo que testes significativos de significância podem ser feitos.
7) Não há preocupação em que a variação do erro do modelo seja homogênea, ou seja, não seja alterada deterministicamente em momentos específicos, sugerindo os Mínimos Quadrados Ponderados. Não há preocupação em encontrar uma transformação de potência ideal para lidar com a variação de erro proporcional ao valor esperado Quando (e por que) você deve registrar o log de uma distribuição (de números)? .
8) O usuário deve pré-especificar todos os possíveis efeitos de lead e lag em torno de eventos / feriados. Por exemplo, as vendas diárias geralmente começam a aumentar no final de novembro, refletindo um efeito de longo prazo do Natal.
9) Não há preocupação de que os erros resultantes estejam livres de estrutura, sugerindo maneiras de melhorar o modelo via verificação de diagnóstico quanto à suficiência.
10) Aparentemente, nenhuma preocupação em melhorar o modelo excluindo estruturas não significativas.
11) Não há possibilidade de obter uma família de previsões simuladas em que os limites de confiança podem não ser necessariamente simétricos através da inicialização dos erros do modelo, com a possibilidade de possíveis anomalias.
12) Permitir que o usuário faça suposições sobre tendências (número de pontos de interrupção de tendências e pontos de interrupção reais) permite uma flexibilidade indesejável / inutilizável em face de análises em larga escala, que por seu nome são projetadas para aplicativos em grande escala sem o uso das mãos.