Ao responder a essa pergunta, John Christie sugeriu que o ajuste dos modelos de regressão logística fosse avaliado pela avaliação dos resíduos. Eu estou familiarizado com a interpretação de resíduos no OLS, eles estão na mesma escala que o DV e muito claramente a diferença entre y e y previstos pelo modelo. No entanto, para a regressão logística, no passado, normalmente apenas examinei as estimativas de ajuste do modelo, por exemplo, AIC, porque não tinha certeza do que um resíduo significaria para uma regressão logística. Depois de examinar um pouco os arquivos de ajuda do R, vejo que no R existem cinco tipos de resíduos glm disponíveis c("deviance", "pearson", "working","response", "partial")
,. O arquivo de ajuda refere-se a:
- Davison, AC e Snell, EJ (1991) Residuals and diagnostics. In: Teoria Estatística e Modelagem. Em homenagem a Sir David Cox, FRS , orgs. Hinkley, DV, Reid, N. e Snell, EJ, Chapman & Hall.
Eu não tenho uma cópia disso. Existe uma maneira curta de descrever como interpretar cada um desses tipos? Em um contexto logístico, a soma dos resíduos quadrados fornecerá uma medida significativa do ajuste do modelo ou será melhor para um Critério de Informação?
binnedplot
função no braço do pacote R fornece um gráfico muito útil de resíduos. É bem descrito nas p. 97-101 de Gelman e Hill 2007 .