A fórmula que você cita em suas anotações não é exatamente a AIC.
AIC é .−2logL+2k
Aqui darei um esboço de uma derivação aproximada que deixa claro o que está acontecendo.
Se você possui um modelo com erros normais independentes com variação constante,
L∝σ−ne−12σ2∑ε2i
que pode ser estimado com a máxima probabilidade de
∝∝∝(σ^2)−n/2e−12nσ^2/σ^2(σ^2)−n/2e−12n(σ^2)−n/2
(supondo que a estimativa de seja a estimativa de ML)σ2
Então (-se ao deslocamento por uma constante)−2logL+2k=nlogσ^2+2k
Agora no modelo ARMA, se é realmente grande em comparação com p e q , então a probabilidade pode ser aproximada por um tal quadro Gaussian (por exemplo, você pode escrever o ARMA aproximadamente como um AR mais tempo e condição em termos suficiente para escrever que AR como modelo de regressão), então com T no lugar de n :TpqTn
AIC≈Tlogσ^2+2k
conseqüentemente
AIC/T≈logσ^2+2k/T
Agora, se você está simplesmente comparando AICs, essa divisão por não importa, pois não altera a ordem dos valores da AIC.T
No entanto, se você estiver usando o AIC para algum outro objetivo que dependa do valor real das diferenças no AIC (como fazer inferência multimodal conforme descrito por Burnham e Anderson), isso importa.
Numerosos textos econométricos parecem usar esse formulário AIC / T. Estranhamente, alguns livros parecem referenciar Hurvich e Tsai 1989 ou Findley 1985 para essa forma, mas Hurvich & Tsai e Findley parecem estar discutindo a forma original (embora eu tenha apenas uma indicação indireta do que Findley faz agora, talvez exista algo em Findley).
Tal escala pode ser feito por uma variedade de razões - por exemplo, séries temporais, especialmente séries temporais de alta frequência, pode ser muito longo e AICs comuns podem ter uma tendência a se tornar inviável, especialmente se é muito pequena. (Existem outros motivos possíveis, mas como eu realmente não sei o motivo disso, não começarei a listar todos os motivos possíveis.)σ2
Você pode gostar de ver a lista de fatos e falácias da AIC de Rob Hyndman - particularmente os itens 3 a 7. Alguns desses pontos podem levar você a ter pelo menos um pouco de cautela ao confiar demais na aproximação da probabilidade gaussiana, mas talvez haja uma justificativa melhor do que eu ofereço aqui.
Não tenho certeza de que haja uma boa razão para usar essa aproximação à probabilidade de log em vez da AIC real, pois muitos pacotes de séries temporais hoje em dia tendem a calcular (/ maximizar) a probabilidade de log real para os modelos ARMA. Parece haver poucas razões para não usá-lo.