Eu acho que você está confundindo a soma residual de dois quadrados que você possui. Você tem um RSS para estimar o na fórmula; este RSS é, em certo sentido, independente do número de parâmetros, . Esse deve ser estimado usando todas as suas covariáveis, fornecendo uma unidade de base de erro . Você deve chamar o RSS na fórmula do AIC : , o que significa que corresponde ao modelo com parâmetros ( pode haver muitos modelos com parâmetros ). Portanto, o RSS na fórmula é calculado para um modelo específico, enquanto o RSS parap σ 2RSSpiippσ^2pσ^2RSSpiippσ^2 é para o modelo completo.
Isto também é indicada na página anterior, onde σ 2 é introduzido para C p .σ^2Cp
Portanto, o RSS da fórmula na AIC não é independente de , é calculado para um determinado modelo. Apresentando σ 2 a tudo isso é apenas para ter uma unidade de linha de base para o erro, de modo que há uma "justa" comparação entre o número de parâmetros e a redução no erro. Você precisa comparar o número de parâmetros com algo escalonado com a magnitude do erro.pσ^2
Se você não dimensionasse o RSS pelo erro de linha de base, pode ser que o RSS esteja caindo muito mais do que o número de variáveis introduzidas e, assim, você se tornará mais ganancioso ao adicionar mais variáveis. Se você dimensioná-lo para alguma unidade, a comparação com o número de parâmetros é independente da magnitude do erro da linha de base.
Essa não é a maneira geral de calcular o AIC, mas basicamente se resume a algo semelhante a isso nos casos em que é possível derivar versões mais simples da fórmula.