Eu estive analisando a modelagem de efeitos mistos usando o pacote lme4 em R. Estou usando principalmente o lmer
comando, por isso vou fazer minha pergunta por meio de código que usa essa sintaxe. Suponho que possa ser uma pergunta fácil geral, é correto comparar dois modelos construídos no lmer
uso de taxas de verossimilhança com base em conjuntos de dados idênticos? Acredito que a resposta deve ser "não", mas posso estar incorreta. Eu li informações conflitantes sobre se os efeitos aleatórios devem ser os mesmos ou não, e qual componente dos efeitos aleatórios significa isso? Então, apresentarei alguns exemplos. Vou tirá-los de dados de medidas repetidas usando estímulos de palavras, talvez algo como Baayen (2008) seja útil na interpretação.
Digamos que eu tenho um modelo em que existem dois preditores de efeitos fixos, os quais chamaremos de A e B, e alguns efeitos aleatórios ... palavras e assuntos que os perceberam. Eu poderia construir um modelo como o seguinte.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(observe que deixei de fora intencionalmente data =
e assumiremos que sempre quero dizer REML = FALSE
com clareza)
Agora, dos seguintes modelos, quais são aceitáveis para comparar com uma razão de verossimilhança ao modelo acima e quais não são?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Reconheço que a interpretação de algumas dessas diferenças pode ser difícil ou impossível. Mas vamos deixar isso de lado por um segundo. Eu só quero saber se há algo fundamental nas mudanças aqui que exclui a possibilidade de comparação. Também quero saber se, se os LRs estão bem, e as comparações da AIC também.