Na verdade, estou revisando um manuscrito em que os autores comparam os modelos de regressão de 5-6 logit com a AIC. No entanto, alguns dos modelos têm termos de interação sem incluir os termos covariáveis individuais. Faz algum sentido fazer isso?
Por exemplo (não específico para modelos de logit):
M1: Y = X1 + X2 + X1*X2
M2: Y = X1 + X2
M3: Y = X1 + X1*X2 (missing X2)
M4: Y = X2 + X1*X2 (missing X1)
M5: Y = X1*X2 (missing X1 & X2)
Eu sempre tive a impressão de que, se você tiver o termo de interação X1 * X2, também precisará de X1 + X2. Portanto, os modelos 1 e 2 seriam bons, mas os modelos 3-5 seriam problemáticos (mesmo que o AIC seja mais baixo). Isso está correto? É uma regra ou mais uma diretriz? Alguém tem uma boa referência que explica o raciocínio por trás disso? Eu só quero ter certeza de que não comunico mal nada importante na revisão.
Obrigado por qualquer pensamento, Dan
:
é para interações, como em A: B. E *
é para efeitos principais e interações, então A * B = A + B + A: B. Então, se (!) Os autores do artigo seguem essa notação, não acho que nenhum dos modelos esteja perdendo os efeitos principais?