As somas de quadrados na regressão linear são casos especiais dos valores de desvio mais gerais no modelo linear generalizado. No modelo mais geral, há uma distribuição de respostas com média vinculada a uma função linear das variáveis explicativas (com um termo de interceptação). As três estatísticas de desvio em um GLM são definidas como:
Desvio nulo Desvio ExplicadoDesvio residual† DTO T= 2 (ℓ^S-ℓ^0 0) ,DR EG= 2 (ℓ^p-ℓ^0 0) , DR ES= 2 (ℓ^S-ℓ^p) .
Nessas expressões, o valor é a probabilidade maximizada de log em um modelo saturado (um parâmetro por ponto de dados), é a probabilidade maximizada de log em um modelo nulo (apenas para interceptação ) e é a probabilidade logarítmica maximizada no modelo (termo de interceptação e coeficientes ).ℓ^Sℓ^0 0ℓ^pp
Essas estatísticas de desvio desempenham um papel análogo às versões em escala das somas de quadrados na regressão linear. É fácil ver que eles satisfazem a decomposição , que é análoga à decomposição das somas de quadrados em regressão linear. De fato, no caso em que você tem uma distribuição de resposta normal com uma função de link linear, obtém um modelo de regressão linear e as estatísticas de desvio são reduzidas para o seguinte:DTO T=DR EG+DR ES
DTO T=1 1σ2∑i = 1n(yEu-y¯)2=1 1σ2⋅ SSTO T,DR EG=1 1σ2∑i = 1n(y^Eu-y¯)2=1 1σ2⋅ SSR EG,DR ES=1 1σ2∑i = 1n(yEu-y^Eu)2=1 1σ2⋅ SSR ES.
Agora, o coeficiente de variação em um modelo de regressão linear é uma estatística de qualidade de ajuste que mede a proporção da variação total na resposta atribuível às variáveis explicativas. Uma extensão natural no caso de um GLM é formar a estatística:
R2G L M= 1 -DR ESDTO T=DR EGDTO T.
É fácil ver que essa estatística se reduz ao coeficiente de variação no caso especial de regressão linear, uma vez que os valores de escala se cancelam. No contexto mais amplo de um GLM, a estatística tem uma interpretação natural que é análoga à sua interpretação em regressão linear: fornece a proporção do desvio nulo que é explicada pelas variáveis explicativas no modelo.
Agora que vimos como as somas de quadrados na regressão linear se estendem aos desvios em um GLM, podemos ver que o coeficiente de variação regular é inadequado no modelo não linear, pois é específico ao caso de um modelo linear com um termo de erro normalmente distribuído. No entanto, podemos ver que, embora o coeficiente de variação padrão seja inadequado, é possível formar uma analogia apropriada usando os valores de desvio, com uma interpretação análoga.
† O desvio residual às vezes é chamado apenas de desvio.