Chris Chatfield, cujos livros e documentos de qualidade eu gostei de ler, em (1) dá os seguintes conselhos:
Por exemplo, a escolha entre os modelos de séries temporais ARIMA com valores baixos e aproximadamente iguais da AIC provavelmente deve ser feita, não sobre o que acontece para fornecer a AIC mínima, mas sobre a qual fornece as melhores previsões dos dados do ano mais recente.
Qual é a justificativa para esse conselho? Se estiver correto, por que o forecast :: auto.arima e outras rotinas de previsão não o seguem? Ainda a ser implementado? Ele já foi discutido aqui que, para olhar para os modelos que só passou a dar o mínimo AIC provavelmente não é uma boa idéia. Por que a opção de ter modelos ARIMA com valores baixos, mas aproximadamente iguais (por exemplo, dentro de 1 ou 2 valores da AIC mínima) não é um padrão em grande parte do software de previsão de séries temporais?
(1) Chatfield, C. (1991). Evitando armadilhas estatísticas. Statistical Science, 6 (3), 240–252. Disponível online, URL: https://projecteuclid.org/euclid.ss/1177011686 .