Eu tenho um modelo linear clássico, com 5 possíveis regressores. Eles não estão correlacionados entre si e têm uma correlação bastante baixa com a resposta. Cheguei a um modelo em que três dos regressores têm coeficientes significativos para sua estatística t (p <0,05). A adição de uma ou das duas variáveis restantes fornece valores de p> 0,05 para a estatística t, para as variáveis adicionadas. Isso me leva a acreditar que o modelo de 3 variáveis é "melhor".
No entanto, usando o comando anova (a, b) em R, onde a é o modelo de 3 variáveis eb é o modelo completo, o valor de p para a estatística F é <0,05, o que me diz para preferir o modelo completo sobre a variável 3 modelo. Como posso conciliar essas aparentes contradições?
Obrigado PS Edit: Alguns antecedentes. Isso é tarefa de casa, então não vou postar detalhes, mas não temos detalhes do que os regressores representam - eles são apenas numerados de 1 a 5. Somos solicitados a "derivar um modelo apropriado, justificando".