Estou refletindo sobre a discussão em torno desta questão e, em particular, o comentário de Frank Harrell de que a estimativa de variação em um modelo reduzido (ou seja, do qual várias variáveis explicativas foram testadas e rejeitadas) deve usar os graus de liberdade generalizados de Ye . O professor Harrell ressalta que isso estará muito mais próximo dos graus residuais de liberdade do modelo "completo" original (com todas as variáveis inseridas) do que do modelo final (do qual várias variáveis foram rejeitadas).
Questão 1. Se eu quiser usar uma abordagem apropriada para todos os resumos e estatísticas padrão de um modelo reduzido (mas com falta de uma implementação completa dos Graus de Liberdade Generalizados), uma abordagem razoável seria usar apenas os graus residuais de liberdade de o modelo completo em minhas estimativas de variância residual, etc?
Pergunta 2. Se o exposto acima for verdadeiro e eu quero fazer isso R
, pode ser tão simples quanto definir
finalModel$df.residual <- fullModel$df.residual
em algum momento do exercício de ajuste de modelo, em que finalModel e fullModel foram criados com lm () ou uma função semelhante. Após o qual funções como summary () e confint () parecem funcionar com o df.residual desejado, embora retorne uma mensagem de erro informando que alguém claramente se interessou pelo objeto finalModel.
lmer
saída. Veja o raciocínio dele aqui .