Assintoticamente, minimizar o AIC é equivalente a minimizar o MSE de validação cruzada de exclusão única para dados transversais [ 1 ]. Então, quando temos a AIC, por que alguém usa o método de dividir os dados em conjuntos de treinamento, validação e teste para medir as propriedades preditivas dos modelos? Quais são especificamente os benefícios dessa prática?
Posso pensar em uma razão: se alguém deseja avaliar o desempenho preditivo dos modelos, a análise fora da amostra é útil. Mas, embora a AIC não seja uma medida da precisão da previsão , geralmente se tem uma boa idéia se algum modelo estiver atingindo seu potencial máximo (para os dados que lhe são fornecidos) em termos de quão bem você será capaz de prever.