Dadas três variáveis, y
e x
, que são positivas contínuas e z
, que são categóricas, tenho dois modelos candidatos dados por:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
e
fit.fe <- lm( y ~ 1 + x )
Espero comparar esses modelos para determinar qual modelo é mais apropriado. Parece-me que, em certo sentido, fit.fe
está aninhado por dentro fit.me
. Normalmente, quando esse cenário geral ocorre, um teste qui-quadrado pode ser realizado. Em R
, podemos executar este teste com o seguinte comando,
anova(fit.fe,fit.me)
Quando ambos os modelos contêm de efeitos aleatórios (gerados por lmer
do lme4
pacote), o anova()
comando funciona bem. Devido aos parâmetros de contorno, normalmente é aconselhável testar a estatística resultante do qui-quadrado via simulação, no entanto, ainda podemos usar a estatística no procedimento de simulação.
Quando os dois modelos contêm apenas efeitos fixos, essa abordagem - e o anova()
comando associado - funcionam bem.
No entanto, quando um modelo contém efeitos aleatórios e o modelo reduzido contém apenas efeitos fixos, como no cenário acima, o anova()
comando não funciona.
Mais especificamente, eu recebo o seguinte erro:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Há algo de errado em usar a abordagem Chi-Square de cima (com simulação)? Ou isso é simplesmente um problema de anova()
não saber lidar com modelos lineares gerados por diferentes funções?
Em outras palavras, seria apropriado gerar manualmente a estatística do qui-quadrado derivada dos modelos? Em caso afirmativo, quais são os graus de liberdade adequados para comparar esses modelos? Pela minha conta:
Estamos estimando dois parâmetros no modelo de efeitos fixos (inclinação e interceptação) e mais dois parâmetros (parâmetros de variação para a inclinação aleatória e interceptação aleatória) no modelo de efeitos mistos. Tipicamente, o parâmetro de intercepção não é contado nos graus de liberdade computação, de modo que implica que e ; tendo dito que não tenho certeza se os parâmetros de variação para os parâmetros de efeitos aleatórios devem ser incluídos nos cálculos dos graus de liberdade; as estimativas de variância para parâmetros de efeito fixo não são consideradas , mas acredito que seja porque as estimativas de parâmetro para efeitos fixos são consideradas constantes desconhecidas enquanto são consideradas variáveis aleatórias desconhecidaspara efeitos mistos. Eu gostaria de receber alguma ajuda sobre esse assunto.
Finalmente, alguém tem uma R
solução ( baseada em) mais apropriada para comparar esses modelos?
lm()
porgls()
donlme
pacote elmer()
porlme()
(novamente donlme
pacote), tudo funcionará bem. Mas observe que você obterá um teste conservador (valores- p muito grandes ), pois os parâmetros para o modelo mais simples estão no limite do espaço de parâmetros. E realmente a escolha de incluir os efeitos aleatórios deve basear-se na teoria (por exemplo, no plano de amostragem), não em um teste estatístico.