Como o ACF & PACF identifica a ordem dos termos MA e AR?


12

Faz mais de 2 anos que trabalho em diferentes séries temporais. Li em muitos artigos que o ACF é usado para identificar a ordem do termo MA e o PACF para AR. Existe uma regra geral de que, para a MA, o atraso em que o ACF é desligado repentinamente é a ordem da MA e da mesma forma para o PACF e AR.

Aqui está um dos artigos que segui da PennState Eberly College of Science.

Minha pergunta é por que é assim? Para mim, mesmo o ACF pode dar o termo AR. Eu preciso da explicação da regra básica mencionada acima. Não consigo entender a regra do polegar intuitivamente / matematicamente por isso -

A identificação de um modelo de RA é geralmente melhor realizada com o PACF.
A identificação de um modelo de MA geralmente é melhor realizada com o ACF do que com o PACF

Observe: - Eu não preciso de como, mas "POR QUÊ". :)

Respostas:


9

As aspas são do link no OP:

A identificação de um modelo de RA é geralmente melhor realizada com o PACF.

Para um modelo de RA, o PACF teórico "desliga" além da ordem do modelo. A frase "desligado" significa que, em teoria, as autocorrelações parciais são iguais a 0 além desse ponto. Em outras palavras, o número de autocorrelações parciais diferentes de zero fornece a ordem do modelo AR. Por "ordem do modelo", entendemos o atraso mais extremo de x usado como preditor.

... a regressão ordem , escrita como AR (k), é uma regressão linear múltipla na qual o valor da série a qualquer momento t é uma função (linear) dos valores às vezes t - 1 , t - 2 , , t - k :kºt-1 1,t-2,,t-k:

yt=β0 0+β1 1yt-1 1+β2yt-2++β2yt-k+ϵt.

Essa equação se parece com um modelo de regressão, conforme indicado no paginado vinculado ... Então, qual é a possível intuição do que estamos fazendo ...

Em sussurros chineses ou no jogo telefônico, como ilustrado aqui

insira a descrição da imagem aqui

a mensagem fica distorcida à medida que é sussurrada de pessoa para pessoa, e todos os vestígios de semelhança (quaisquer palavras verdadeiras, se você desejar) são perdidos após o participante vermelho (com exceção do artigo 'a'). O PACF nos diria que os coeficientes para os participantes azul e amarelo não contribuem assim que o efeito dos participantes marrom e vermelho é contabilizado (o participante verde no final da linha não distorce a mensagem).

Não é difícil chegar muito perto da saída real da função R, obtendo regressões OLS consecutivas através da origem de sequências mais atrasadas e coletando os coeficientes em um vetor. Esquematicamente,

insira a descrição da imagem aqui

um processo muito semelhante ao jogo telefônico - chegará a um ponto em que não haverá variabilidade no sinal da série temporal inicial real encontrada em fragmentos de si mesma progressivamente mais distantes.


A identificação de um modelo de MA geralmente é melhor realizada com o ACF do que com o PACF .

Para um modelo de MA, o PACF teórico não é desligado, mas diminui para 0 de alguma maneira. Um padrão mais claro para um modelo MA está no ACF. O ACF terá autocorrelações diferentes de zero apenas nos atrasos envolvidos no modelo.

Um termo da média móvel em um modelo de série temporal é um erro passado (multiplicado por um coeficiente).

O modelo de média móvel da ordem , indicado por MA (q), éqº

xt=μ+Wt+θ1 1Wt-1 1+θ2Wt-2++θqWt-q

comWtEuEudN(0 0,σW2).

Aqui, não é a semelhança da mensagem entre os pontos do tempo que é pesquisada para trás no tempo, passo a passo, mas a contribuição do ruído, que eu imagino como os desvios frequentemente maciços que uma caminhada aleatória pode levar ao longo da linha do tempo:

insira a descrição da imagem aqui

Aqui existem várias seqüências progressivamente deslocadas que são correlacionadas, descartando qualquer contribuição das etapas intermediárias. Este seria o gráfico das operações envolvidas:insira a descrição da imagem aqui

A este respeito, "CV é legal!" não é completamente diferente de "Naomi tem uma piscina". Do ponto de vista do ruído, as rimas ainda estão lá até o início do jogo.


Esta é uma resposta muito legal, bom trabalho (+1)
Firebug

Rob Hyndman sugere essa estratégia para o ARIMA, que usa pacf e acf para determinar os pedidos. Precisamos saber de antemão quais séries temos para usar a estratégia descrita em sua resposta? obrigado!
Stucash

Por favor, tome minha resposta como um exercício didático. Eu não sou especialista no tópico.
Antoni Parellada

4

Robert Nau, da Fuqua School of Business da Duke, fornece uma explicação detalhada e um tanto intuitiva de como os gráficos ACF e PACF podem ser usados ​​para escolher pedidos de AR e MA aqui e aqui . Faço um breve resumo de seus argumentos abaixo.

Uma explicação simples de por que o PACF identifica a ordem AR

kkk

Uma explicação mais completa que também aborda o uso do ACF para identificar a ordem MA

As séries temporais podem ter assinaturas de AR ou MA:

  • Uma assinatura de AR corresponde a um gráfico do PACF exibindo um corte agudo e um ACF em decomposição mais lenta;
  • Uma assinatura MA corresponde a um gráfico ACF exibindo um corte agudo e um gráfico PACF que decai mais lentamente.

As assinaturas de RA são frequentemente associadas à autocorrelação positiva no atraso 1, sugerindo que a série é ligeiramente "subdiferenciada" (isso significa que outras diferenças são necessárias para eliminar completamente a autocorrelação). Como os termos de AR alcançam diferenciação parcial (veja abaixo), isso pode ser corrigido adicionando um termo de AR ao modelo (daí o nome dessa assinatura). Portanto, um gráfico PACF com um corte agudo (acompanhado por um gráfico ACF decaindo lentamente com um primeiro atraso positivo) pode indicar a ordem do termo RA. Nau coloca o seguinte:

Se o PACF da série diferenciada exibir um corte agudo e / ou a autocorrelação lag-1 for positiva - ou seja, se a série parecer um pouco "subdiferenciada" -, considere adicionar um termo de RA ao modelo. O atraso no qual o PACF é cortado é o número indicado de termos de RA.

As assinaturas MA, por outro lado, são comumente associadas aos primeiros atrasos negativos, sugerindo que a série é "superdiferenciada" (ou seja, é necessário cancelar parcialmente a diferenciação para obter uma série estacionária). Como os termos MA podem cancelar uma ordem de diferenciação (veja abaixo), o gráfico ACF de uma série com uma assinatura MA indica a ordem MA necessária:

Se o ACF da série diferenciada exibir um corte agudo e / ou a autocorrelação lag-1 for negativa - isto é, se a série parecer um pouco "superdiferenciada" -, considere adicionar um termo MA ao modelo. O atraso no qual o ACF é cortado é o número indicado de termos de MA.

Por que os termos AR alcançam diferenciação parcial e os termos MA cancelam parcialmente a diferenciação anterior

Tome um modelo básico ARIMA (1,1,1), apresentado sem a constante por simplicidade:

yt=Yt-Yt-1 1

yt=ϕyt-1 1+et-θet-1 1

B

yt=(1 1-B)Yt

yt=ϕByt+et-θBet

que pode ser ainda mais simplificado para fornecer:

(1 1-ϕB)yt=(1 1-θB)et

ou equivalente:

(1 1-ϕB)(1 1-B)Yt=(1 1-θB)et

(1 1-ϕB)ϕ(0 0,1 1)B(1 1-θB)(1 1-B)


2

Em um nível superior, eis como entender isso. (Se você precisar de uma abordagem mais matemática, posso seguir com prazer algumas das minhas anotações sobre análise de séries temporais)

ACF e PACF são construções estatísticas teóricas, assim como um valor ou variação esperada, mas em domínios diferentes. Da mesma forma que os valores esperados aparecem no estudo de variáveis ​​aleatórias, o ACF e o PACF surgem no estudo de séries temporais.

Ao estudar variáveis ​​aleatórias, há a questão de como estimar seus parâmetros, que é onde entram o método dos momentos, MLE e outros procedimentos e construções, além de inspecionar as estimativas, seus erros padrão e etc.

Inspecionar as estimativas de ACF e PACF vem da mesma idéia, estimar os parâmetros de um processo aleatório de séries temporais. Entendeu a ideia?

Se você acha que precisa de uma resposta mais inclinada matematicamente, entre em contato e tentarei ver se consigo criar alguma coisa até o final do dia.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.