Tentarei responder ao gentil desejo do whuber de simplesmente "responder à pergunta" e permanecer no tópico. Recebemos 144 leituras mensais de uma série chamada "The Airline Series". Box e Jenkins foram amplamente criticados por fornecerem uma previsão muito alta devido à “natureza explosiva” de uma transformação registrada reversa.
Visualmente, temos a impressão de que a variação da série original aumenta com o nível da série, sugerindo a necessidade de uma transformação. No entanto, sabemos que um dos requisitos para um modelo útil é que a variação dos "erros de modelo" precise ser homogênea. Nenhuma suposição é necessária sobre a variação da série original. Eles são idênticos se o modelo for simplesmente uma constante, ou seja, y (t) = u. Como /stats//users/2392/probabilityislogic afirmou tão claramente em sua resposta ao conselho sobre explicação de heterogeneidade / heterocedasticidade, “uma coisa que eu sempre acho divertida é essa" não normalidade dos dados "que as pessoas preocupam sobre. Os dados não precisam ser distribuídos normalmente, mas o termo do erro precisa ”
O trabalho inicial de séries temporais muitas vezes erroneamente chegou a conclusões sobre transformações injustificadas. Descobriremos aqui que a transformação corretiva para esses dados é simplesmente adicionar três séries fictícias de indicadores ao modelo ARIMA, refletindo um ajuste para três pontos de dados incomuns. A seguir, é apresentado o gráfico da função de autocorrelação, sugerindo uma forte autocorrelação no atraso 12 (0,76) e no atraso 1 (0,948). As autocorrelações são simplesmente coeficientes de regressão em um modelo em que y é a variável dependente prevista por um atraso de y.
!
A análise acima sugere que se modele as primeiras diferenças da série e estude essa "série residual", que é idêntica às primeiras diferenças primeiro por suas propriedades.
Essa análise confirma a ideia de que existe um forte padrão sazonal nos dados que poderiam ser remediados ou modelados por um modelo que continha dois operadores diferentes.
Essa diferenciação dupla simples produz um conjunto de resíduos, também conhecido como série ajustada, ou que fala vagamente uma série transformada que evidencia variação não constante, mas a razão para a variação não constante é a média não constante dos resíduos. série duplamente diferenciada, sugerindo três anomalias no final da série. A autocorrelação desta série indica falsamente que "está tudo bem" e pode haver necessidade de qualquer ajuste de Ma (1). Deve-se tomar cuidado, pois há uma sugestão de anomalias nos dados, portanto, a ACF é enviesada para baixo. Isso é conhecido como “Efeito Alice no País das Maravilhas”, ou seja, aceitar a hipótese nula de nenhuma estrutura evidenciada quando essa estrutura está sendo mascarada por uma violação de uma das suposições.
Detectamos visualmente três pontos incomuns (117.135.136)
Essa etapa de detecção dos outliers é chamada de Detecção de intervenção e pode ser facilmente, ou não tão facilmente, programada após o trabalho de Tsay.
Se adicionarmos três indicadores ao modelo, obteremos
Podemos então estimar
E receba um gráfico dos resíduos e do acf
Essa avaliação sugere que adicionemos potencialmente dois coeficientes médios móveis ao modelo. Assim, o próximo modelo estimado pode ser.
Produzindo
Pode-se então excluir a constante não significativa e obter um modelo refinado:
Observamos que nenhuma transformação de energia foi necessária para obter um conjunto de resíduos com variação constante. Observe que as previsões não são explosivas.
Em termos de uma soma ponderada simples, temos: 13 pesos; 3 diferente de zero e igual a (1.0.1,0., - 1,0)
Este material foi apresentado de uma maneira não automática e, consequentemente, exigiu a interação do usuário em termos de tomada de decisões de modelagem.