Pelo que sei, não há muita diferença entre AIC e BIC. Ambas são aproximações matematicamente convenientes que se pode fazer para comparar modelos com eficiência. Se eles fornecerem modelos "melhores" diferentes, provavelmente significa que você tem alta incerteza, o que é mais importante para se preocupar do que se você deve usar o AIC ou o BIC. Pessoalmente, gosto mais da BIC porque ela pede mais (menos) de um modelo se tiver mais (menos) dados para ajustar seus parâmetros - como um professor pedindo um padrão de desempenho mais alto (mais baixo) se o aluno tiver mais (menos) ) tempo para aprender sobre o assunto. Para mim, isso parece ser a coisa mais intuitiva a se fazer. Mas tenho certeza de que também existem argumentos igualmente intuitivos e convincentes para a AIC, dada sua forma simples.
Agora, sempre que você fizer uma aproximação, certamente haverá algumas condições quando essas aproximações forem lixo. Isso pode ser visto certamente para a AIC, onde existem muitos "ajustes" (AICc) para dar conta de certas condições que tornam a aproximação original ruim. Isso também está presente para o BIC, porque existem vários outros métodos mais exatos (mas ainda eficientes), como Aproximações de Fully Laplace para misturas de g-priors de Zellner (BIC é uma aproximação ao método de aproximação de Laplace para integrais).
Um lugar em que ambos são uma porcaria é quando você tem informações prévias substanciais sobre os parâmetros em qualquer modelo. AIC e BIC penalizam desnecessariamente modelos onde os parâmetros são parcialmente conhecidos em comparação com modelos que exigem que os parâmetros sejam estimados a partir dos dados.
P(D|M,A)P(M|D,A)MMA
Mi:the ith model is the best description of the dataA:out of the set of K models being considered, one of them is the best
E, em seguida, continuando a atribuir os mesmos modelos de probabilidade (mesmos parâmetros, mesmos dados, mesmas aproximações etc.), receberei o mesmo conjunto de valores BIC. Somente anexando algum tipo de significado único à letra lógica "M" é que se atrai perguntas irrelevantes sobre o "modelo verdadeiro" (ecos da "religião verdadeira"). A única coisa que "define" M são as equações matemáticas que a utilizam em seus cálculos - e isso quase nunca define uma e apenas uma definição. Eu poderia igualmente fazer uma proposição de previsão sobre M ("o i-ésimo modelo fornecerá as melhores previsões"). Pessoalmente, não consigo ver como isso mudaria as probabilidades e, portanto, quão bom ou ruim o BIC será (o AIC também) - embora o AIC seja baseado em uma derivação diferente)
E, além disso, o que está errado com a declaração Se o verdadeiro modelo está no conjunto Estou pensando, então há uma probabilidade de 57% que é o modelo B . Parece bastante razoável para mim, ou você pode ir para a versão mais "suave", há uma probabilidade de 57% de que o modelo B é o melhor do conjunto considerado
Um último comentário: acho que você encontrará tantas opiniões sobre a AIC / BIC quanto pessoas que as conhecem.