No primeiro nível, acho que tudo o que você está ignorando é o encolhimento em relação aos valores da população; " as inclinações e interceptações por sujeito do modelo de efeitos mistos estão mais próximas das estimativas populacionais do que as estimativas de mínimos quadrados dentro do sujeito " . [ref. 1] O link a seguir provavelmente também será útil ( Quais são os descritivos apropriados para os meus modelos mistos? ), Veja a resposta de Mike Lawrence).
Além disso, acho que você é um pouco azarado no seu exemplo de brinquedo, porque possui um design perfeitamente equilibrado que faz com que você tenha exatamente a mesma estimativa no caso de não haver valores ausentes.
Experimente o código a seguir, que tem o mesmo processo sem nenhum valor ausente agora:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Onde agora, como seu design não é perfeitamente equilibrado, você não tem as mesmas estimativas de coeficiente.
Na verdade, se você jogar junto com seu padrão de valor ausente de uma maneira boba (por exemplo:), y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
para que seu design ainda esteja perfeitamente equilibrado, você obterá os mesmos coeficientes novamente.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Você está marginalmente desorientado pelo design perfeito do seu experimento original. Quando você inseriu os NAs de uma maneira desequilibrada, alterou o padrão de quanta "força" os sujeitos individuais poderiam emprestar um do outro.
Em resumo, as diferenças que você vê são devidas a efeitos de retração e, mais especificamente, porque você distorceu seu design perfeitamente equilibrado original com valores ausentes não perfeitamente equilibrados.
Ref 1: Douglas Bates lme4: modelagem de efeitos mistos com R , páginas 71-72
m3
é 0,0011713" em vez dem2
.