Algumas advertências antes de prosseguir. Como costumo sugerir aos meus alunos, use as auto.arima()
coisas apenas como uma primeira aproximação ao seu resultado final ou se você deseja ter um modelo parcimonioso ao verificar se o seu modelo baseado em teoria rival se sai melhor.
Dados
Você deve começar claramente pela descrição dos dados de séries temporais com os quais está trabalhando. Na macroeconomia, você geralmente trabalha com dados agregados, e os meios geométricos (surpreendentemente) têm mais evidências empíricas para os dados de séries temporais macro, provavelmente porque a maioria deles se decompõe em tendência de crescimento exponencial .
A propósito, a sugestão de Rob "visualmente" funciona para séries temporais com parte sazonal clara , pois os dados anuais que variam lentamente são menos claros para os aumentos na variação. Felizmente, a tendência de crescimento exponencial é geralmente vista (se parece ser linear, não há necessidade de registros).
Modelo
Y( t ) = Xα1 11 1( T ) . . . Xαkk( t ) ε ( t )
Na econometria financeira, os logs são comuns devido à popularidade dos retornos dos logs, porque ...
As transformações de log possuem boas propriedades
αEuY( T )XEu( T )
Nos modelos de correção de erros, temos uma suposição empiricamente mais forte de que as proporções são mais estáveis ( estacionárias ) do que as diferenças absolutas.
Na econometria financeira, é fácil agregar os retornos do log ao longo do tempo .
Existem muitas outras razões não mencionadas aqui.
Finalmente
Observe que a transformação de log geralmente é aplicada a variáveis não-negativas (nível). Se você observar as diferenças de duas séries temporais (exportação líquida, por exemplo), nem é possível fazer o registro, é necessário procurar dados originais em níveis ou assumir a forma de tendência comum que foi subtraída.
[ adição após edição ] Se você ainda deseja um critério estatístico para quando fazer a transformação de log, uma solução simples seria qualquer teste de heterocedasticidade. No caso de uma variação crescente, eu recomendaria o teste de Goldfeld-Quandt ou similar. Em R, ele está localizado library(lmtest)
e é denotado por gqtest(y~1)
função. Basta regredir no termo de interceptação, se você não tiver nenhum modelo de regressão, y
é sua variável dependente.