Então, eu entendo que a seleção de variáveis faz parte da seleção de modelos. Mas em que consiste exatamente a seleção de modelos? É mais do que o seguinte:
1) escolha uma distribuição para o seu modelo
2) escolha variáveis explicativas?
Pergunto isso porque estou lendo um artigo Burnham & Anderson: AIC vs BIC, onde eles falam sobre AIC e BIC na seleção de modelos. Lendo este artigo, percebo que estive pensando em 'seleção de modelo' como 'seleção de variável' (ref. Comentários A BIC tenta encontrar um modelo verdadeiro? )
Um trecho do artigo em que eles falam sobre 12 modelos com graus crescentes de "generalidade" e esses modelos mostram "efeitos cônicos" (Figura 1) quando KL-Information é plotado contra os 12 modelos:
FILOSOFIAS DIFERENTES E MODELOS ALVO ... Apesar de o alvo do BIC ser um modelo mais geral que o modelo alvo do AIC, o modelo mais frequentemente selecionado aqui pelo BIC será menos geral que o Modelo 7, a menos que n seja muito grande. Pode ser o modelo 5 ou 6. Sabe-se (de inúmeros artigos e simulações na literatura) que, no contexto de efeitos de redução gradual (Figura 1), a AIC tem um desempenho melhor que o BIC. Se esse é o contexto da análise real dos dados, a AIC deve ser usada.
Como pode BIC sempre escolher um modelo mais complexo do AIC na selecção do modelo Eu não entendo! O que especificamente é "seleção de modelo" e quando especificamente a BIC escolhe um modelo mais "geral" que a AIC?
Se estamos falando sobre seleção de variáveis, o BIC certamente deve sempre escolher o modelo com menor quantidade de variáveis, correto? Os termo no BIC sempre penaliza as variáveis adicionadas mais do que o termo no AIC. Mas isso não é irracional quando " o alvo da BIC é um modelo mais geral que o modelo da AIC "?
EDIT :
De uma discussão nos comentários em Existe algum motivo para preferir o AIC ou o BIC em detrimento do outro? vemos uma pequena discussão entre @ Michael Chernick e @ user13273 nos comentários, levando-me a acreditar que isso é algo que não é tão trivial:
Eu acho que é mais apropriado chamar essa discussão como seleção de "recurso" ou seleção "covariável". Para mim, a seleção de modelos é muito mais ampla, envolvendo a especificação da distribuição de erros, a forma da função de link e a forma de covariáveis. Quando falamos sobre AIC / BIC, normalmente estamos na situação em que todos os aspectos da construção de modelos são fixos, exceto a seleção de covariáveis. O que você está procurando?
A decisão das covariáveis específicas a serem incluídas em um modelo geralmente é feita pelo termo seleção de modelo e há vários livros com seleção de modelo no título que decidem principalmente quais covariáveis / parâmetros de modelo incluir no modelo. #: 22612 Michael Chernick