Eu tenho um GLMM com uma distribuição binomial e uma função de link de logit e tenho a sensação de que um aspecto importante dos dados não está bem representado no modelo.
Para testar isso, eu gostaria de saber se os dados estão bem descritos por uma função linear na escala de logit. Por isso, gostaria de saber se os resíduos são bem comportados. No entanto, não consigo descobrir em que plotagem de resíduos traçar e como interpretar a trama.
Observe que estou usando a nova versão do lme4 ( a versão de desenvolvimento do GitHub ):
packageVersion("lme4")
## [1] ‘1.1.0’
Minha pergunta é: como inspecionar e interpretar os resíduos de um modelo misto linear generalizado binomial com uma função de link logit?
Os dados a seguir representam apenas 17% dos meus dados reais, mas o ajuste já leva cerca de 30 segundos na minha máquina, então deixo assim:
require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))
dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif")
dat$V1 <- factor(dat$V1)
m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial)
A plotagem mais simples ( ?plot.merMod
) produz o seguinte:
plot(m1)
Isso já me diz alguma coisa?
true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1)
funciona? Será que a estimativa give modelo de interação entre distance*consequent
, distance*direction
, distance*dist
e inclinação de direction
e dist
que varia com V1
? O que o quadrado (consequent+direction+dist)^2
denota?
Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.123941 (tol = 0.001, component 1)
. Por quê ?
type=c("p","smooth")
emplot.merMod
, ou movendo-se paraggplot
se você quiser intervalos de confiança) é que parece que há um pequeno, mas significativo padrão, que você pode ser corrigido adotando uma função de link diferente. É isso até agora ...