Estou executando um modelo logístico. O conjunto de dados do modelo real tem mais de 100 variáveis, mas estou escolhendo um conjunto de dados de teste no qual existem cerca de 25 variáveis. Antes disso, eu também fiz um conjunto de dados com 8 a 9 variáveis. Me disseram que os valores de AIC e SC podem ser usados para comparar o modelo. Observei que o modelo apresentava valores mais altos de SC, mesmo quando a variável apresentava valores baixos de p (ex. 0053). Para minha intuição, um modelo que possui variáveis com bom nível de significância deve resultar em baixos valores de SC e AIC. Mas isso não está acontecendo. Alguém pode esclarecer isso. Em resumo, quero fazer as seguintes perguntas:
- O número de variáveis tem algo a ver com o SC AIC?
- Devo me concentrar nos valores de p ou em valores baixos de SC AIC?
- Quais são as formas típicas de reduzir os valores do SC AIC?