Esta pergunta / tópico surgiu em uma discussão com um colega e eu estava procurando algumas opiniões sobre isso:
Estou modelando alguns dados usando uma regressão logística de efeitos aleatórios, mais precisamente uma regressão logística de interceptação aleatória. Para os efeitos fixos, tenho 9 variáveis que são de interesse e são consideradas. Eu gostaria de fazer algum tipo de seleção de modelo para encontrar as variáveis que são significativas e fornecer o "melhor" modelo (apenas efeitos principais).
Minha primeira idéia foi usar o AIC para comparar modelos diferentes, mas com 9 variáveis, não fui muito empolgado para comparar 2 ^ 9 = 512 modelos diferentes (palavra-chave: dragagem de dados).
Eu discuti isso com um colega e ele me disse que se lembrava de ler sobre o uso da seleção de modelos passo a passo (ou para a frente) com GLMMs. Mas, em vez de usar um valor p (por exemplo, com base em um teste de razão de verossimilhança para GLMMs), deve-se usar o AIC como critério de entrada / saída.
Achei essa ideia muito interessante, mas não encontrei referências que discutissem mais sobre isso e meu colega não se lembrava de onde a lia. Muitos livros sugerem o uso da AIC para comparar modelos, mas não encontrei nenhuma discussão sobre o uso junto com um procedimento de seleção de modelo progressivo ou avançado.
Então, eu tenho basicamente duas perguntas:
Há algo de errado em usar o AIC em um procedimento de seleção de modelo gradual como critério de entrada / saída? Se sim, qual seria a alternativa?
Você tem algumas referências que discutem o procedimento acima que (também como referência para um relatório final?
melhor,
Emilia