Interpretação do modelo ARIMA

Eu tenho uma pergunta sobre os modelos ARIMA. Digamos que eu tenha uma série temporal que gostaria de prever e um modelo parece ser uma boa maneira de conduzir o exercício de previsão. Agora, os atrasados implicam que minha série hoje seja influenciada por eventos anteriores. Isso faz sentido. Mas qual é a interpretação dos erros? Meu resíduo anterior (como estava o meu cálculo) está influenciando o valor da minha série hoje? Como os resíduos defasados são calculados nessa regressão, pois é o produto / restante da regressão? $Y_t$ $\text{ARIMA}(2,2)$

Δ Y_{t} = α_{1} Δ Y_{t - 1} + α_{2} Δ Y_{t - 2} + ν_{t} + θ_{1} ν_{t - 1} + θ_{2} ν_{t - 2}

$\Delta Y_t = \alpha_1 \Delta Y_{t-1} + \alpha_2 \Delta Y_{t-2} + \nu_{t} + \theta_1 \nu_{t-1} + \theta_2 \nu_{t-2}$

Y

$Y$

regression time-series interpretation

— gabriel
fonte

Penso que você precisa se lembrar de que os modelos ARIMA são modelos ateóricos ; portanto, as regras usuais de interpretação dos coeficientes de regressão estimados não se aplicam estritamente da mesma maneira. Os modelos ARIMA têm certos recursos que você deve conhecer. Por exemplo, quanto menor os valores de em um AR (1), mais rápida é a taxa de convergência. Mas, por exemplo, um modelo AR (2). Nem todos os modelos AR (2) são iguais! Por exemplo, se a condição for satisfeita, o AR (2) exibirá um comportamento pseudo-periódico e, como resultado, suas previsões serão ciclos estocásticos.

α_{1}

$\alpha_{1}$

(α_{1}^{2} + 4 α_{2} < 0)

$(\alpha_{1}^{2}+4\alpha_{2}<0)$

— Graeme Walsh

(cont ...) De maneira um pouco semelhante, ao lidar com regressões automáticas de vetores, tende-se a interpretar as funções de resposta ao impulso (IRFs) do que os coeficientes estimados; os coeficientes são muitas vezes difíceis de interpretar, mas geralmente é possível fazer sentido das IRFs. Por curiosidade, você encontrou muitos trabalhos nos quais o (s) autor (es) dedicou muita atenção à interpretação dos coeficientes em um modelo ARIMA?

— Graeme Walsh

Parece haver um problema de notação. " " não pode estar certo, pois os modelos ARIMA têm três termos para cada um dos componentes AR / I / MA, respectivamente, enquanto os modelos ARMA têm dois (por exemplo, ) - mas você parece ter a primeira diferenciação, o que sugere que você queira dizer . Edite para refletir sua intenção.

ARIMA (2, 2)

$\text{ARIMA}(2,2)$

(p, d, q)

$(p,d,q)$

ARMA (2, 2)

$\text{ARMA}(2,2)$

ARIMA (2, 1, 2)

$\text{ARIMA}(2,1,2)$

— Glen_b -Reinstala Monica

@ Glen_b Lembro-me de perguntar a mesma coisa em outra pergunta . Acontece que temos uma espécie de duplicação. A presente questão e a que está ligada são muito semelhantes.

— Graeme Walsh

Eu acho que você precisa se lembrar de que os modelos ARIMA são modelos ateóricos ; portanto, a abordagem usual para interpretar os coeficientes de regressão estimados não se aplica realmente à modelagem ARIMA.

Para interpretar (ou entender) os modelos estimados do ARIMA, seria bom conhecer os diferentes recursos exibidos por vários modelos comuns do ARIMA.

Podemos explorar alguns desses recursos investigando os tipos de previsões produzidas por diferentes modelos ARIMA. Essa é a principal abordagem que eu adotei abaixo, mas uma boa alternativa seria examinar as funções de resposta a impulsos ou os caminhos de tempo dinâmicos associados a diferentes modelos ARIMA (ou equações de diferença estocástica). Eu vou falar sobre isso no final.

Modelos AR (1)

Vamos considerar um modelo AR (1) por um momento. Nesse modelo, podemos dizer que quanto menor o valor de , mais rápida é a taxa de convergência (para a média). Podemos tentar entender esse aspecto dos modelos de AR (1) investigando a natureza das previsões para um pequeno conjunto de modelos de AR (1) simulados com valores diferentes para . $\alpha_{1}$ $\alpha_{1}$

O conjunto de quatro modelos de AR (1) que discutiremos pode ser escrito em notação algébrica como: que é uma constante e o restante da notação segue o OP. Como pode ser visto, cada modelo difere apenas em relação ao valor de .

Y_{t} = C + 0,95 Y_{t - 1} + ν_{t} (1) Y_{t} = C + 0,8 Y_{t - 1} + ν_{t} (2) Y_{t} = C + 0,5 Y_{t - 1} + ν_{t} (3) Y_{t} = C + 0,4 Y_{t - 1} + ν_{t} (4)

$\begin{equation} Y_{t} = C + 0.95 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (1)\\ Y_{t} = C + 0.8 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (2)\\ Y_{t} = C + 0.5 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (3)\\ Y_{t} = C + 0.4 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (4) \end{equation}$

C

$C$

α_{1}

$\alpha_{1}$

No gráfico abaixo, plotei previsões fora da amostra para esses quatro modelos de AR (1). Pode-se observar que as previsões para o modelo AR (1) com convergem em uma taxa mais lenta em relação aos outros modelos. As previsões para o modelo AR (1) com convergem em uma taxa mais rápida que as outras. $\alpha_{1} = 0.95$ $\alpha_{1} = 0.4$

insira a descrição da imagem aqui

Nota: quando a linha vermelha estiver na horizontal, alcançou a média das séries simuladas.

Modelos MA (1)

Agora vamos considerar quatro modelos MA (1) com valores diferentes para . Os quatro modelos que discutiremos podem ser escritos como: $\theta_{1}$

Y_{t} = C + 0,95 ν_{t - 1} + ν_{t} (5) Y_{t} = C + 0,8 ν_{t - 1} + ν_{t} (6) Y_{t} = C + 0,5 ν_{t - 1} + ν_{t} (7) Y_{t} = C + 0,4 ν_{t - 1} + ν_{t} (8)

$\begin{equation} Y_{t} = C + 0.95 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (5)\\ Y_{t} = C + 0.8 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (6)\\ Y_{t} = C + 0.5 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (7)\\ Y_{t} = C + 0.4 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (8) \end{equation}$

No gráfico abaixo, plotei previsões fora da amostra para esses quatro modelos MA (1) diferentes. Como mostra o gráfico, o comportamento das previsões nos quatro casos é marcadamente semelhante; convergência rápida (linear) com a média. Observe que há menos variedade na dinâmica dessas previsões em comparação com as dos modelos AR (1).

insira a descrição da imagem aqui

Nota: quando a linha vermelha estiver na horizontal, alcançou a média das séries simuladas.

Modelos AR (2)

As coisas ficam muito mais interessantes quando começamos a considerar modelos ARIMA mais complexos. Tomemos, por exemplo, os modelos AR (2). Estes são apenas um pequeno passo em relação ao modelo AR (1), certo? Bem, pode-se pensar que, mas a dinâmica dos modelos de AR (2) é bastante rica em variedade, como veremos a seguir.

Vamos explorar quatro modelos diferentes de AR (2):

Y_{t} = C + 1.7 Y_{t - 1} - 0,8 Y_{t - 2} + ν_{t} (9) Y_{t} = C + 0,9 Y_{t - 1} - 0,2 Y_{t - 2} + ν_{t} (10) Y_{t} = C + 0,5 Y_{t - 1} - 0,2 Y_{t - 2} + ν_{t} (11) Y_{t} = C + 0,1 Y_{t - 1} - 0,7 Y_{t - 2} + ν_{t} (12)

$\begin{equation} Y_{t} = C + 1.7 Y_{t-1} -0.8 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (9)\\ Y_{t} = C + 0.9 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (10)\\ Y_{t} = C + 0.5 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (11)\\ Y_{t} = C + 0.1 Y_{t-1} -0.7 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (12) \end{equation}$

As previsões fora da amostra associadas a cada um desses modelos são mostradas no gráfico abaixo. É bem claro que cada um deles difere significativamente e também é um grupo bastante variado em comparação com as previsões que vimos acima - exceto as previsões do modelo 2 (gráfico superior direito) que se comportam de maneira semelhante às de um RA (1) modelo.

insira a descrição da imagem aqui

Nota: quando a linha vermelha estiver na horizontal, alcançou a média das séries simuladas.

O ponto principal aqui é que nem todos os modelos AR (2) têm a mesma dinâmica! Por exemplo, se a condição, for satisfeita, o modelo AR (2) exibirá comportamento pseudo-periódico e como resultado, suas previsões aparecerão como ciclos estocásticos. Por outro lado, se essa condição não for atendida, ciclos estocásticos não estarão presentes nas previsões; em vez disso, as previsões serão mais semelhantes às de um modelo de AR (1).

α_{1}^{2} + 4 α_{2} < 0 0,

$\begin{equation} \alpha_{1}^{2}+4\alpha_{2} < 0, \end{equation}$

Vale a pena notar que a condição acima vem da solução geral para a forma homogênea da equação da diferença linear, autônoma e de segunda ordem (com raízes complexas). Se isso lhe é estranho, recomendo o Capítulo 1 de Hamilton (1994) e o Capítulo 20 de Hoy et al. (2001)

Testar a condição acima para os quatro modelos de AR (2) resulta no seguinte:

(1.7)^{2} + 4 (- 0,8) = - 0,31 < 0 0 (13) (0,9)^{2} + 4 (- 0,2) = 0,01 > 0 0 (14) (0,5)^{2} + 4 (- 0,2) = - 0,55 < 0 0 (15) (0,1)^{2} + 4 (- 0,7) = - 2,54 < 0 0 (16)

$\begin{equation} (1.7)^{2} + 4 (-0.8) = -0.31 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (13)\\ (0.9)^{2} + 4 (-0.2) = 0.01 > 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (14)\\ (0.5)^{2} + 4 (-0.2) = -0.55 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (15)\\ (0.1)^{2} + 4 (-0.7) = -2.54 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (16) \end{equation}$

Conforme esperado pelo aparecimento das previsões plotadas, a condição é satisfeita para cada um dos quatro modelos, exceto o modelo 2. Lembre-se do gráfico, as previsões do modelo 2 se comportam ("normalmente") de forma semelhante às previsões de um modelo AR (1). As previsões associadas aos outros modelos contêm ciclos.

Aplicação - Modelagem da inflação

Agora que temos alguns conhecimentos básicos, vamos tentar interpretar um modelo AR (2) em um aplicativo. Considere o seguinte modelo para a taxa de inflação ( ): Uma expressão natural a ser associada a esse modelo seria algo como: "hoje a inflação depende do nível de inflação ontem e do nível de inflação de anteontem" $\pi_{t}$

π_{t} = C + α_{1} π_{t - 1} + α_{2} π_{t - 2} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{2} \pi_{t-2} + \nu_{t}. \end{equation}$ . Agora, eu não argumentaria contra essa interpretação, mas eu sugeriria que se precisasse de cautela e que deveríamos nos aprofundar um pouco mais para conceber uma interpretação adequada. Nesse caso, poderíamos perguntar: de que maneira a inflação está relacionada aos níveis anteriores de inflação? Existem ciclos? Se sim, quantos ciclos existem? Podemos dizer algo sobre o pico e o vale? Com que rapidez as previsões convergem para a média? E assim por diante.

Esses são os tipos de perguntas que podemos fazer ao tentar interpretar um modelo AR (2) e, como você pode ver, não é tão simples quanto obter um coeficiente estimado e dizer "um aumento de 1 unidade nessa variável está associado a um so- aumento de muitas unidades na variável dependente " - certificando-se de anexar a condição ceteris paribus a essa afirmação, é claro.

Lembre-se de que, em nossa discussão até agora, apenas exploramos uma seleção dos modelos AR (1), MA (1) e AR (2). Nem sequer analisamos a dinâmica de modelos ARMA mistos e modelos ARIMA envolvendo defasagens mais altas.

Para mostrar o quão difícil seria interpretar modelos que se enquadram nessa categoria, imagine outro modelo de inflação - um ARMA (3,1) com restrito a zero: $\alpha_{2}$

π_{t} = C + α_{1} π_{t - 1} + α_{3} π_{t - 3} + θ_{1} ν_{t - 1} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{3} \pi_{t-3} + \theta_{1}\nu_{t-1} + \nu_{t}. \end{equation}$

Diga o que você gostaria, mas aqui é melhor tentar entender a dinâmica do próprio sistema. Como antes, podemos observar e ver que tipo de previsão o modelo produz, mas a abordagem alternativa que mencionei no início desta resposta foi examinar a função de resposta a impulsos ou o caminho de tempo associado ao sistema.

Isso me leva à próxima parte da minha resposta, onde discutiremos as funções de resposta a impulsos.

Funções de resposta ao impulso

Aqueles que estão familiarizados com as regressões automáticas de vetores (VARs) saberão que geralmente se tenta entender o modelo estimado de VAR, interpretando as funções de resposta a impulsos; ao invés de tentar interpretar os coeficientes estimados que geralmente são difíceis de interpretar.

A mesma abordagem pode ser adotada ao tentar entender os modelos ARIMA. Ou seja, ao invés de tentar entender declarações (complicadas) como "a inflação de hoje depende da inflação de ontem e da inflação de dois meses atrás, mas não da inflação da semana passada!" , em vez disso, plotamos a função de resposta a impulso e tentamos entender isso.

Aplicação - Quatro variáveis macro

Para este exemplo (baseado em Leamer (2010)), vamos considerar quatro modelos ARIMA baseados em quatro variáveis macroeconômicas; Crescimento do PIB, inflação, taxa de desemprego e taxa de juros de curto prazo. Os quatro modelos foram estimados e podem ser escritos como: que indica crescimento do PIB no momento , indica inflação, indica taxa de desemprego

\begin{array}{rcl} Y_{t} & = & 3,20 + 0,22 Y_{t - 1} + 0,15 Y_{t - 2} + ν_{t} \\ π_{t} & = & 4.10 + 0,46 π_{t - 1} + 0,31 π_{t - 2} + 0,16 π_{t - 3} + 0,01 π_{t - 4} + ν_{t} \\ {você}_{t} & = & 6.2 + 1,58 {você}_{t - 1} - 0,64 {você}_{t - 2} + ν_{t} \\ r_{t} & = & 6.0 + 1,18 r_{t - 1} - 0,23 r_{t - 2} + ν_{t} \end{array}

$\begin{eqnarray} Y_{t} &=& 3.20 + 0.22 Y_{t-1} + 0.15 Y_{t-2} + \nu_{t}\\ \pi_{t} &=& 4.10 + 0.46 \pi_{t-1} + 0.31\pi_{t-2} + 0.16\pi_{t-3} + 0.01\pi_{t-4} + \nu_{t}\\ u_{t} &=& 6.2+ 1.58 u_{t-1} - 0.64 u_{t-2} + \nu_{t}\\ r_{t} &=& 6.0 + 1.18 r_{t-1} - 0.23 r_{t-2} + \nu_{t} \end{eqnarray}$

Y_{t}

$Y_{t}$

t

$t$

π

$\pi$

u

$u$

r

$r$ denota a taxa de juros de curto prazo (tesouraria de 3 meses).

As equações mostram que o crescimento do PIB, a taxa de desemprego e a taxa de juros de curto prazo são modelados como processos de RA (2), enquanto a inflação é modelada como um processo de RA (4).

Em vez de tentar interpretar os coeficientes em cada equação, vamos plotar as funções de resposta ao impulso (IRFs) e interpretá-las. O gráfico abaixo mostra as funções de resposta ao impulso associadas a cada um desses modelos.

insira a descrição da imagem aqui

Não tome isso como uma masterclass na interpretação de IRFs - pense nisso mais como uma introdução básica - mas, de qualquer maneira, para nos ajudar a interpretar os IRFs, precisaremos nos acostumar com dois conceitos; impulso e persistência .

Esses dois conceitos são definidos em Leamer (2010) da seguinte maneira:

Momentum : Momentum é a tendência de continuar se movendo na mesma direção. O efeito momentum pode compensar a força de regressão (convergência) em direção à média e pode permitir que uma variável se afaste de sua média histórica, por algum tempo, mas não indefinidamente.

Persistência : uma variável de persistência fica em torno de onde está e converge lentamente apenas para a média histórica.

Equipados com esse conhecimento, fazemos agora a pergunta: suponha que uma variável esteja em sua média histórica e receba um choque unitário temporário em um único período, como a variável responderá em períodos futuros? É como fazer as perguntas que fizemos anteriormente, como as previsões contêm ciclos? , com que rapidez as previsões convergem para a média? etc.

Por fim, agora podemos tentar interpretar os IRFs.

Após um choque de uma unidade, a taxa de desemprego e a taxa de juros de curto prazo (tesouraria de 3 meses) são levadas mais longe de sua média histórica. Este é o efeito do momento. Os IRFs também mostram que a taxa de desemprego ultrapassa em maior medida do que a taxa de juros de curto prazo.

Também vemos que todas as variáveis retornam às suas médias históricas (nenhuma delas "explode"), embora cada uma faça isso em taxas diferentes. Por exemplo, o crescimento do PIB retorna à sua média histórica após cerca de 6 períodos após um choque, a taxa de desemprego retorna à sua média histórica após cerca de 18 períodos, mas a inflação e os juros de curto prazo levam mais de 20 períodos para retornar aos seus meios históricos. Nesse sentido, o crescimento do PIB é a menos persistente das quatro variáveis, enquanto se pode dizer que a inflação é altamente persistente.

Eu acho que é uma conclusão justa dizer que conseguimos (pelo menos parcialmente) entender o que os quatro modelos ARIMA estão nos dizendo sobre cada uma das quatro variáveis macro.

Conclusão

Em vez de tentar interpretar os coeficientes estimados nos modelos ARIMA (difícil para muitos modelos), tente entender a dinâmica do sistema. Podemos tentar isso explorando as previsões produzidas por nosso modelo e plotando a função de resposta a impulsos.

[Estou feliz o suficiente em compartilhar meu código R, se alguém quiser.]

Referências

Hamilton, JD (1994). Análise de séries temporais (Vol. 2). Princeton: Imprensa da universidade de Princeton.
Leamer, E. (2010). Padrões e histórias macroeconômicas - Um guia para MBAs, Springer.
Stengos, T., M. Hoy, J. Livernois, C. McKenna e R. Rees (2001). Matemática para Economia, 2ª edição, MIT Press: Cambridge, MA.

— Graeme Walsh
fonte

Adoro a aplicação do IRF a não-VARs. Eles sempre parecem estar associados e eu nunca pensei em usar IRFs em meros ARIMAs. (Que mais, que pode realmente entender o que termos MA fazer?)

— Wayne

Que ótima resposta!

— Richard Hardy

Observe que, devido ao teorema de decomposição de Wold, você pode reescrever qualquer modelo ARMA estacionário como um modelo , ou seja: $MA(\infty)$

Δ Y_{t} = \sum_{j = 0 0}^{\infty} ψ_{j} ν_{t - j}

$\Delta Y_t=\sum_{j=0}^{\infty} \psi_j\nu_{t-j}$

Nesta forma, não há variáveis atrasadas, portanto, qualquer interpretação envolvendo a noção de uma variável atrasada não é muito convincente. No entanto, olhando os modelos e separadamente: $MA(1)$ $AR(1)$

Y_{t} = ν_{t} + θ_{1} ν_{t - 1}

$Y_t=\nu_t+\theta_{1}\nu_{t-1}$

Y_{t} = ρ Y_{t - 1} + ν_{t} = ν_{t} + ρ ν_{t - 1} + ρ^{2} ν_{t - 1} + . . .

$Y_t=\rho Y_{t-1}+\nu_{t}=\nu_t+\rho \nu_{t-1}+ \rho^2 \nu_{t-1}+...$

você pode dizer que os termos de erro nos modelos ARMA explicam a influência "de curto prazo" do passado, e os termos defasados explicam a influência de "longo prazo". Dito isto, não acho que isso ajude muito e, geralmente, ninguém se incomoda com a interpretação precisa dos coeficientes ARMA. O objetivo geralmente é obter um modelo adequado e usá-lo na previsão.

— mpiktas
fonte

+1 Isso é mais ou menos o que eu estava tentando entender nos meus comentários acima.

— Graeme Walsh

Não vi seus comentários quando estava escrevendo a resposta. Sugiro convertê-los para a resposta.

— Mvctas

$n$ $c_1,c_2,...,c_n$

Y (t) = c_{1} Y (t - 1) + c_{2} Y (t - 2) + c_{3} Y (t - 3) + . . . + c_{n} Y (t - n) + uma (t)

$Y(t) =c_1 Y(t−1) + c_2 Y(t-2) + c_3 Y(t-3)+ ... + c_n Y(t-n) + a(t)$

Desta forma, um modelo ARIMA pode ser explicado como a resposta à pergunta

Quantos valores históricos devo usar para calcular uma soma ponderada do passado?
Precisamente quais são esses valores?

— IrishStat
fonte