É incomum que o MEAN supere o ARIMA?

Recentemente, apliquei uma variedade de métodos de previsão (MEAN, RWF, ETS, ARIMA e MLPs) e constatei que MEAN se saiu surpreendentemente bem. (MEAN: onde todas as previsões futuras são previstas como sendo iguais à média aritmética dos valores observados.) MEAN até superou o ARIMA nas três séries que usei.

O que eu quero saber é se isso é incomum? Isso significa que as séries temporais que estou usando são estranhas? Ou isso indica que eu configurei algo errado?

forecasting arima

— Andy T
fonte

en.wikipedia.org/wiki/Martingale_%28probability_theory%29

— Mehrdad

O @Mehrdad definitivamente poderia criar uma boa resposta em Martingales.

— shadowtalker

É bastante comum que métodos simples tenham um bom desempenho, especialmente fora da amostra (que é onde importa). Este efeito se torna mais forte em séries curtas. Se não houver muita correlação ou tendência serial, esperaríamos que a média se desse muito bem, mesmo em séries relativamente longas.

— Glen_b -Reinstala Monica 25/11

Respostas:

Sou praticante, produtor e usuário de previsões e NÃO um estatístico treinado. Abaixo, compartilho alguns dos meus pensamentos sobre por que sua previsão média foi melhor do que o ARIMA, referindo-se a um artigo de pesquisa que se baseia em evidências empíricas. Um livro que, repetidamente, volto a referir, é o livro de Princípios de Previsão da Armstrong e seu site, que eu recomendaria como uma excelente leitura para qualquer previsor, fornece excelentes informações sobre o uso e os princípios orientadores dos métodos de extrapolação.

Para responder à sua primeira pergunta - O que eu quero saber é se isso é incomum?

Há um capítulo chamado Extrapolação para dados de séries temporais e transversais, que também está disponível gratuitamente no mesmo site . A seguir, a citação do capítulo

"Por exemplo, na competição M2 em tempo real, que examinou 29 séries mensais, a Box-Jenkins provou ser um dos métodos menos precisos e seu erro médio geral foi 17% maior que o de uma previsão ingênua"

Existe uma evidência empírica sobre por que suas previsões médias foram melhores que os modelos ARIMA.

Também houve estudos após estudos em competições empíricas e a terceira competição M3 que mostra que a abordagem ARIMA da Box - Jenkins não produz previsões precisas e não possui evidências de que tenha um desempenho melhor na extrapolação univariada de tendências.

Há também outro artigo e um estudo em andamento de Greene e Armstrong, intitulado " Previsão simples: evitar lágrimas antes de dormir " no mesmo site. Os autores do artigo resumem da seguinte forma:

No total, identificamos 29 artigos que incorporaram 94 comparações formais da precisão das previsões de métodos complexos com aquelas de métodos simples - mas nem todos sofisticados - em todos os casos. Oitenta e três por cento das comparações descobriram que as previsões de métodos simples eram mais precisas do que, ou similarmente precisas, as de métodos complexos. Em média, os erros de previsões de métodos complexos foram cerca de 32% maiores que os erros de previsões de métodos simples nos 21 estudos que fornecem comparações de erros

Para responder à sua terceira pergunta : isso indica que eu configurei algo errado? Não, consideraria o ARIMA como método complexo e a previsão média como métodos simples. Há ampla evidência de que métodos simples, como a previsão média, superam os métodos complexos, como o ARIMA.

Para responder à sua segunda pergunta : isso significa que as séries temporais que estou usando são estranhas?

Abaixo estão o que considerei especialistas em previsão do mundo real:

Makridakis (competição empírica pioneira em previsão denominada M, M2 e M3, e pavimentou o caminho para métodos baseados em evidências na previsão)
Armstrong (fornece informações valiosas na forma de livros / artigos sobre práticas de previsão)
Gardner (invented Damped Trend suavizando exponencialmente outro método simples que funciona surpreendentemente bem vs. ARIMA)

Todos os pesquisadores acima defendem a simplicidade (métodos como a sua previsão média) vs. métodos complexos como o ARIMA. Portanto, você deve se sentir à vontade para que suas previsões sejam boas e sempre favoreçam a simplicidade à complexidade com base em evidências empíricas. Todos esses pesquisadores contribuíram imensamente para o campo da previsão aplicada.

Além da boa lista de métodos simples de previsão de Stephan. há também outro método chamado Theta forecasting method, que é um método muito simples (basicamente suavização exponencial simples com um desvio que é igual a 1/2 da inclinação da regressão linear) eu adicionaria isso à sua caixa de ferramentas. Forecast package in Rimplementa esse método.

— previsor
fonte

Eu realmente gosto da perspectiva que você fornece sobre a previsão e das evidências que você fornece para apoiá-la, mas os elementos desta resposta são censuráveis porque eles parecem muito com um discurso retórico contra "estatísticos" ou talvez contra o treinamento estatístico formal - e são completamente errados . Por exemplo, os graus avançados de Makridakis estão em (adivinhem?) Estatísticas , é o que ele ensina e é o que ele faz.

— whuber

Entendi, eu vou removê-lo. Eu estava tentando afirmar que grandes avanços nos métodos baseados em evidências vieram de não estatísticos. Mas eu vejo o seu ponto que pode vir através desse jeito

— meteorologista

Feito, também, o Makridakis PHD estava em Sistemas de Informação de Gerenciamento de acordo com esta entrevista publicada

— forecaster

FWIW, sua página no LinkedIn - que ele mantém - lista os dois PhDs em estatística. Mas o argumento é inútil: afirmar que alguém não é estatístico porque seu grau pode não estar especificamente em estatística tem pouco valor e não vem ao caso aqui. (Até muito recentemente a maioria das pessoas cuja carreira foi em estatísticas tinha graus em outros campos porque havia poucos programas de estatísticas disponíveis.)

— whuber

+1. No entanto, você escreve "Existe uma evidência empírica sobre por que suas previsões médias foram melhores que os modelos ARIMA". - não, isso apenas nos diz que a média foi melhor (neste caso específico), não o porquê . Eu mudaria o argumento e colocaria o ônus da prova no ARIMA e em outros modelos. Eu nunca entendi muito bem por que o processo de geração de dados deve se preocupar com erros passados em relação ao meu modelo, que é o que MA chama essencialmente de modelo. Minha suspeita pessoal é que o ARIMA é tão popular porque você pode realmente provar coisas, como raízes unitárias e estacionariedade - não porque prevê bem.

— S. Kolassa - Restabelece Monica 25/11

Isso não é de todo surpreendente . Na previsão, você muito muitas vezes achamos que os métodos extremamente simples, como

a média geral
o passeio aleatório ingênuo (ou seja, a última observação usada como previsão)
uma caminhada aleatória sazonal (ou seja, a observação de um ano atrás)
Suavização exponencial única

superam métodos mais complexos. É por isso que você deve sempre testar seus métodos em relação a esses benchmarks muito simples.

Uma citação de George Athanosopoulos e Rob Hyndman (especialistas na área):

Alguns métodos de previsão são muito simples e surpreendentemente eficazes.

Observe como eles dizem explicitamente que usarão métodos muito simples como benchmarks.

De fato, todo o seu livro on-line gratuito e aberto sobre previsão é muito recomendado.

EDIT: Uma das medidas de erro de previsão mais bem aceitas, o Mean Absolute Scaled Error (MASE) de Hyndman & Koehler (veja também aqui ) mede o quanto uma determinada previsão melhora na previsão de caminhada aleatória ingênua (dentro da amostra): se MASE <1, sua previsão é melhor que a caminhada aleatória dentro da amostra. Você esperaria que isso fosse um limite facilmente derrotado, certo?

Não é assim: às vezes, mesmo o melhor dos vários métodos de previsão padrão, como ARIMA ou ETS, produz apenas um MASE de 1,38, ou seja, é pior (fora da amostra) do que a previsão de caminhada aleatória (dentro da amostra). Isso é suficientemente desconcertante para gerar perguntas aqui. (Essa pergunta não é uma duplicata desta, pois o MASE compara a precisão fora da amostra com a precisão dentro da amostra de um método ingênuo, mas também é esclarecedor para a presente pergunta.)

— S. Kolassa - Restabelecer Monica
fonte

Obrigado por aceitar, mas talvez você queira esperar um dia - se uma pergunta aceitar respostas, menos pessoas a lerão, muito menos comentar ou responder. E outras pessoas podem ter opiniões diferentes sobre isso. Sinta-se à vontade para cancelar a aceitação ;-) #

— 9789 S. Kolassa # Reinstate Monica

É muito honesto da sua parte :) Vou dar um dia. Obrigado.

— Andy T

"complexo" é um parente próximo de "sobreajustado".

— shadowtalker

+1 boa resposta. Se a previsão fosse um campo baseado em evidências como a medicina, o método ARIMA seria histórico.

— meteorologista

O ARIMA de mente simples, sem validar as suposições gaussianas, já é história para a maioria de nós, mas aparentemente não para todos!

— precisa saber é o seguinte