Está bem estabelecido, pelo menos entre os estatísticos de maior calibre, que os modelos com os valores da estatística da AIC dentro de um certo limite do valor mínimo devem ser considerados tão apropriados quanto o modelo que minimiza a estatística da AIC. Por exemplo, em [1, p.221], encontramos
Os modelos com GCV ou AIC pequeno seriam considerados os melhores. Obviamente, não se deve apenas minimizar cegamente o GCV ou o AIC. Em vez disso, todos os modelos com valores GCV ou AIC razoavelmente pequenos devem ser considerados potencialmente adequados e avaliados de acordo com sua simplicidade e relevância científica.
Da mesma forma, em [2, p.144], temos
Foi sugerido (Duong, 1984) que modelos com valores de AIC dentro de c do valor mínimo sejam considerados competitivos (com c = 2 como um valor típico). A seleção entre os modelos competitivos pode então se basear em fatores como brancura dos resíduos (Seção 5.3) e simplicidade do modelo.
Referências:
- Ruppert, D .; Wand, MP & Carrol, RJ Regressão semiparamétrica , Cambridge University Press, 2003
- Brockwell, PJ & Davis, RA Introdução a séries temporais e previsão , John Wiley & Sons, 1996
Dado o exposto, qual dos dois modelos abaixo deve ser o preferido?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
De maneira mais geral, quando é apropriado selecionar modelos minimizando cegamente a AIC ou a estatística relacionada?