Não se comparar os valores absolutos de dois AICs (que pode ser como , mas também ~ 1000000 ), mas considera a sua diferença :
Δ i = A I C i - A I C m i n ,
em que A I C i é a AIC do i- ésimo modelo, e A I C m i n é a AIC mais baixa que se obtém entre o conjunto de modelos examinados (isto é, o modelo preferido). A regra geral, descrita, por exemplo, em∼100∼1000000
Δi=AICi−AICmin,
AICiiAICminBurnham & Anderson 2004 , é:
- se , existe um apoio substancial ao i- ésimo modelo (ou a evidência contra ele vale apenas uma simples menção), e a proposição de que é uma descrição adequada é altamente provável;Δi<2i
- se , existe um forte suporte para o i- ésimo modelo;2<Δi<4i
- se , há consideravelmente menos suporte para o i- ésimo modelo;4<Δi<7i
- modelos com têm essencialmente nenhum apoio.Δi>10
Agora, com relação aos 0,7% mencionados na questão, considere duas situações:
- e A I C 2 é maior em 0,7%: A I C 2 = 100,7 . Então Δ 2 = 0,7 < 2, portanto não há diferença substancial entre os modelos.AIC1=AICmin=100AIC2AIC2=100.7Δ2=0.7<2
- e A I C 2 é maior em 0,7%: A I C 2 = 100700 . Então Δ 2 = 700 ≫ 10, portanto não há suporte para o 2º modelo.AIC1=AICmin=100000AIC2AIC2=100700Δ2=700≫10
Portanto, dizer que a diferença entre AICs é 0,7% não fornece nenhuma informação.
O valor AIC contém constantes de escala provenientes da probabilidade logarítmica
e, portanto, Δ i estão livres dessas constantes. Pode-se considerar Δ i = A I C i - A I C m i n uma transformação rescaling que as forças o melhor modelo ter A I C m i n : = 0 .LΔiΔi=AICi−AICminAICmin:=0
A formulação da AIC penaliza o uso de um número excessivo de parâmetros, desencorajando o excesso de ajustes. Prefere modelos com menos parâmetros, desde que os outros não ofereçam um ajuste substancialmente melhor. A AIC tenta selecionar um modelo (entre os examinados) que descreva adequadamente a realidade (na forma dos dados sob exame). Isso significa que, de fato, o modelo sendo uma descrição real dos dados nunca é considerado. Observe que o AIC fornece as informações sobre qual modelo descreve melhor os dados, mas não fornece nenhuma interpretação .
Pessoalmente , eu diria que, se você tem um modelo simples e um complicado, com uma AIC muito menor, o modelo simples não é bom o suficiente. Se o modelo mais complexo é realmente muito mais complicado, mas o não é enorme (talvez Δ i < 2 , talvez Δ i < 5 - depende da situação específica), eu me ateria ao modelo mais simples se for realmente mais fácil trabalhar com ele. .ΔiΔi<2Δi<5
Além disso, você pode atribuir uma probabilidade ao ésimo modelo viai
pi=exp(−Δi2),
AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin
Finalmente, em relação à fórmula da AIC:
AIC=2k−2L,
LΔi2kΔi2Δk<1
TL; DR
- É uma má razão; use a diferença entre os valores absolutos dos AICs.
- A porcentagem não diz nada.
- Não é possível responder a essa pergunta devido a nenhuma informação sobre os modelos, dados e o que significam diferentes resultados .