Respostas:
Deixe LL = loglikelihood
Aqui está um resumo rápido do que você vê na saída de resumo (glm.fit),
Desvio nulo = 2 (LL (modelo saturado) - LL (modelo nulo)) em df = df_Sat - df_Null
Desvio residual = 2 (LL (modelo saturado) - LL (modelo proposto)) df = df_Sat - df_Proposed
O Modelo Saturado é um modelo que assume que cada ponto de dados possui seus próprios parâmetros (o que significa que você tem n parâmetros para estimar).
O Modelo Nulo assume exatamente o "oposto", ou seja, assume um parâmetro para todos os pontos de dados, o que significa que você estima apenas 1 parâmetro.
O Modelo proposto pressupõe que você possa explicar seus pontos de dados com parâmetros p + um termo de interceptação, para que você tenha parâmetros p + 1.
Se o seu desvio nulo é realmente pequeno, significa que o modelo nulo explica muito bem os dados. Da mesma forma com o seu desvio residual .
O que significa realmente pequeno? Se o seu modelo for "bom", seu desvio será de aproximadamente Chi ^ 2 com graus de liberdade (df_sat - df_model).
Se você quiser comparar seu modelo nulo com o modelo proposto, poderá ver
(Desvio nulo - desvio residual) aproximado Chi ^ 2 com df Proposta - df Nulo = (n- (p + 1)) - (n-1) = p
Os resultados que você forneceu diretamente do R? Eles parecem um pouco estranhos, porque geralmente você deve ver que os graus de liberdade relatados no Nulo são sempre maiores que os graus de liberdade relatados no Residual. Isso ocorre porque, novamente, Desvio nulo df = df saturado - Nulo df = n-1 Desvio residual df = df saturado - Proposta df = n- (p + 1)
O desvio nulo mostra quão bem a resposta é prevista pelo modelo com nada além de um intercepto.
O desvio residual mostra quão bem a resposta é prevista pelo modelo quando os preditores são incluídos. A partir do seu exemplo, pode-se observar que o desvio aumenta 3443.3 quando são adicionadas 22 variáveis preditivas (nota: graus de liberdade = número de observações - número de preditores). Esse aumento no desvio é uma evidência de uma falta significativa de ajuste.
Também podemos usar o desvio residual para testar se a hipótese nula é verdadeira (ou seja, o modelo de regressão logística fornece um ajuste adequado para os dados). Isso é possível porque o desvio é dado pelo valor do qui-quadrado em certos graus de liberdade. Para testar a significância, podemos descobrir valores p associados usando a fórmula abaixo em R:
p-value = 1 - pchisq(deviance, degrees of freedom)
Usando os valores acima de desvio residual e DF, você obtém um valor p de aproximadamente zero, mostrando que há uma falta significativa de evidência para apoiar a hipótese nula.
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
?