O processo de construção do modelo envolve um construtor de modelos tomando muitas decisões. Uma das decisões envolve a escolha entre diferentes classes de modelos a serem exploradas. Existem muitas classes de modelos que podem ser consideradas; por exemplo, modelos ARIMA, modelos ARDL, modelos com várias fontes de erros no espaço de estado, modelos LSTAR, modelos Min-Max, para citar apenas alguns. Obviamente, algumas classes de modelos são mais amplas que outras e não é comum descobrir que algumas classes de modelos são subclasses de outras.
Dada a natureza da questão, podemos nos concentrar principalmente em apenas duas classes de modelos; modelos lineares e não lineares .
Com a imagem acima em mente, começarei a abordar a questão dos OPs sobre quando é útil adotar um modelo não linear e se existe uma estrutura lógica para fazê-lo - de uma perspectiva estatística e metodológica.
A primeira coisa a notar é que os modelos lineares são uma pequena subclasse de modelos não lineares. Em outras palavras, modelos lineares são casos especiais de modelos não lineares. Existem algumas exceções nessa declaração, mas, para os propósitos atuais, não perderemos muito aceitando-a para simplificar as coisas.
Normalmente, um construtor de modelos seleciona uma classe de modelos e continua a escolher um modelo dentro dessa classe específica, empregando alguma metodologia. Um exemplo simples é quando se decide modelar uma série temporal como um processo ARIMA e, em seguida, segue a metodologia Box-Jenkins para selecionar um modelo dentre a classe de modelos ARIMA. Trabalhar dessa maneira, com metodologias associadas a famílias de modelos, é uma questão de necessidade prática.
Uma conseqüência da decisão de construir um modelo não linear é que o problema de seleção de modelos se torna muito maior (mais modelos devem ser considerados e mais decisões são enfrentadas) quando comparados à escolha entre um conjunto menor de modelos lineares, para que haja um real questão prática em questão. Além disso, pode até não haver metodologias totalmente desenvolvidas (conhecidas, aceitas, entendidas, fáceis de se comunicar) a serem usadas para selecionar dentre algumas famílias de modelos não lineares. Além disso, outra desvantagem da construção de modelos não lineares é que os modelos lineares são mais fáceis de usar e suas propriedades probabilísticas são mais conhecidas ( Teräsvirta, Tjøstheim e Granger (2010) ).
Dito isto, o PO solicita bases estatísticas para orientar a decisão em vez de práticas ou teóricas do domínio, por isso devo continuar.
Antes mesmo de pensar em como lidar com a seleção de quais modelos não lineares trabalhar, é preciso decidir inicialmente se deve trabalhar com modelos lineares ou não lineares. Uma decisão! Como fazer essa escolha?
Recorrendo a Granger e Terasvirta (1993) , adoto o seguinte argumento, que tem dois pontos principais em resposta às duas perguntas seguintes.
P: Quando é útil criar um modelo não linear? Em resumo, pode ser útil construir um modelo não linear quando a classe de modelos lineares já tiver sido considerada e considerada insuficiente para caracterizar o relacionamento sob inspeção. Pode-se dizer que esse procedimento de modelagem não linear (processo de tomada de decisão) vai de simples a geral, no sentido de passar de linear para não linear.
P: Existem bases estatísticas que podem ser usadas para justificar a construção de um modelo não linear? Se alguém decide construir um modelo não linear com base nos resultados dos testes de linearidade, eu diria que sim. Se o teste de linearidade sugerir que não há não linearidade significativa no relacionamento, não seria recomendável a construção de um modelo não linear; o teste deve preceder a decisão de construir.
Vou detalhar esses pontos por referência direta a Granger e Terasvirta (1993):
Antes de construir um modelo não linear, é aconselhável descobrir se de fato um modelo linear caracterizaria adequadamente as relações [econômicas] em análise. Se fosse esse o caso, haveria mais teoria estatística disponível para a construção de um modelo razoável do que se um modelo não linear fosse apropriado. Além disso, obter previsões ideais para mais de um período à frente seria muito mais simples se o modelo fosse linear. Pode acontecer, pelo menos quando as séries temporais são curtas, que o investigador calcule com sucesso um modelo não linear, embora a verdadeira relação entre as variáveis seja linear. O perigo de complicar desnecessariamente a construção do modelo é, portanto, real, mas pode ser diminuído pelo teste de linearidade.
No livro mais recente, Teräsvirta, Tjøstheim e Granger (2010), o mesmo tipo de conselho é dado, que cito agora:
Do ponto de vista prático, é [portanto] útil testar a linearidade antes de tentar estimar o modelo não-linear mais complicado. Em muitos casos, o teste é ainda necessário do ponto de vista estatístico. Vários modelos populares não lineares não são identificados sob linearidade. Se o modelo verdadeiro que gerou os dados for linear e o modelo não linear estiver interessado em aninhar esse modelo linear, os parâmetros do modelo não linear não poderão ser estimados de forma consistente. Assim, o teste de linearidade deve preceder qualquer modelagem e estimativa não linear.
Deixe-me terminar com um exemplo.
No contexto da modelagem de ciclos de negócios, um exemplo prático de uso de bases estatísticas para justificar a construção de um modelo não linear pode ser o seguinte. Como os modelos lineares univariados ou auto-regressivos vetoriais são incapazes de gerar séries temporais cíclicas assimétricas, vale a pena considerar uma abordagem de modelagem não linear, capaz de lidar com assimetrias nos dados. Uma versão expandida deste exemplo sobre reversibilidade de dados pode ser encontrada em Tong (1993) .
Desculpas se eu me concentrei demais em modelos de séries temporais. Tenho certeza, no entanto, de que algumas das idéias também são aplicáveis em outras configurações.