Estou tentando estimar a pontuação média para dois grupos de estudantes. Eu uso um modelo de regressão binomial. Essa total_ans
é a pergunta total que eles responderam, que podem ser diferentes para diferentes alunos.
O modelo 1 estima diretamente
model <- glm(cbind(total_correct, total_ans-total_correct) ~ student_type,family= binomial, data = df)
Call: glm(formula = cbind(total_correct, total_ans - total_correct) ~ student_type, family = binomial, data = df)
Coefficients:
(Intercept) student_group_2
-1.9684 0.2139
Degrees of Freedom: 1552 Total (i.e. Null); 1551 Residual Null
Deviance: 1480 Residual Deviance: 1477 AIC: 1764
lsmeans(model,~ student_type, type="response")
student_type prob SE df asymp.LCL asymp.UCL
student_group_1 0.1225627 0.00654160 NA 0.1103074 0.1359715
student_group_2 0.1474774 0.01275231 NA 0.1241918 0.1742602
No modelo 2, uso um efeito aleatório para explicar melhor as variações individuais.
model <- glmer(cbind(total_correct, total_ans-total_correct) ~ (1|student) + student_type, family= binomial, data = sub_df, control=glmerControl(optimizer = "nloptwrap", calc.derivs = FALSE))
Generalized linear mixed model fit by maximum likelihood (Laplace
Approximation) [glmerMod]
Family: binomial ( logit )
Formula: cbind(total_correct, total_ans - total_correct) ~ (1 | student) +
student_type
Data: sub_df
AIC BIC logLik deviance df.resid
1653.9049 1669.9488 -823.9525 1647.9049 1550
Random effects:
Groups Name Std.Dev.
student (Intercept) 1.881
Number of obs: 1553, groups: author, 1553
Fixed Effects:
(Intercept) student_group_2
-3.0571 0.3915
lsmeans(model,~ student_type, type="response")
student_type prob SE df asymp.LCL asymp.UCL
student_group_1 0.04491007 0.004626728 NA 0.03666574 0.0549025
student_group_2 0.06503249 0.015117905 NA 0.04097546 0.1017156
Estou surpreso que exista uma diferença tão grande entre os resultados nos dois grupos. Qual pode ser a razão disso?
mais informações: o grupo 1 tem 1434 alunos, o grupo 2 tem 119 alunos. estes são grupos que ocorrem naturalmente
emmeans
. A sintaxe provavelmente será quase idêntica.