Pode ajudar você a ler minha resposta aqui: Por que meus valores p diferem entre a saída da regressão logística, o teste qui-quadrado e o intervalo de confiança para a sala de cirurgia? Sua pergunta aqui é quase uma duplicata, mas há alguns elementos adicionais na sua pergunta que podem ser abordados.
summary.glm()
t0 0t
Usar anova.glm()
permite acessar diferentes testes. Quando você define test="Rao"
, ele fornece o valor p de um teste de pontuação. E quando você define um test="Chisq"
ou test="LRT"
(eles são iguais), fornece o valor p de um teste de razão de verossimilhança.
A anova.glm()
função testa a mesma hipótese nula que o teste Wald na summary()
saída nesse caso . Isso ocorre apenas porque seu modelo possui apenas uma variável. A anova.glm()
função executará testes sequenciais, que são análogos ao 'tipo I SS' em uma configuração linear, enquanto os testes de Wald de summary()
são análogos ao 'tipo III SS' em uma configuração linear (veja minha resposta aqui: Como interpretar o tipo I, tipo II e tipo III ANOVA e MANOVA? ). Considerar:
x2 = rnorm(n)
m2 = glm(y~x+x2, family="binomial")
summary(m2)$coefficients
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -0.05906436 0.186876339 -0.3160612 7.519561e-01
# x -0.01567551 0.003537183 -4.4316372 9.352029e-06
# x2 -0.05967796 0.099093504 -0.6022388 5.470152e-01
anova(m2, test="LRT")
# Terms added sequentially (first to last)
#
# Df Deviance Resid. Df Resid. Dev Pr(>Chi)
# NULL 499 619.10
# x 1 20.3841 498 598.72 6.335e-06 ***
# x2 1 0.3627 497 598.35 0.547
m3 = glm(y~x2+x, family="binomial") # I just switched the order of x & x2 here
summary(m3)$coefficients
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -0.05906436 0.186876339 -0.3160612 7.519561e-01
# x2 -0.05967796 0.099093504 -0.6022388 5.470152e-01 # these are the same
# x -0.01567551 0.003537183 -4.4316372 9.352029e-06 # as above
anova(m3, test="LRT")
# Terms added sequentially (first to last)
#
# Df Deviance Resid. Df Resid. Dev Pr(>Chi)
# NULL 499 619.10
# x2 1 0.1585 498 618.94 0.6906 # these differ from the
# x 1 20.5883 497 598.35 5.694e-06 *** # anova output above
Você pode usar a anova.glm()
função para fornecer testes de razão de pontuação e de probabilidade de variáveis individuais em um modelo de regressão logística múltipla que são análogos ao 'SS tipo III', mas é tedioso. Você precisaria continuar reajustando seu modelo para que cada variável, por sua vez, seja listada por último na fórmula fornecida para a glm()
chamada. O último valor p listado na anova.glm()
saída é aquele que será análogo ao 'tipo III SS'.
Para obter os testes de pontuação ou razão de verossimilhança de variáveis individuais de forma mais conveniente, use em seu drop1()
lugar. Considerar:
drop1(m3, test="LRT")
# Single term deletions
#
# Model:
# y ~ x2 + x
# Df Deviance AIC LRT Pr(>Chi)
# <none> 598.35 604.35
# x2 1 598.72 602.72 0.3627 0.547 # the same as when x2 is last above
# x 1 618.94 622.94 20.5883 5.694e-06 *** # the same as when x is last above