Ambos os índices são medidas de força de associação (ou seja, se algum preditor está associado ao resultado, como em um teste de RL) e podem ser usados para quantificar a capacidade preditiva ou o desempenho do modelo. Um único preditor pode ter um efeito significativo no resultado, mas pode não ser necessariamente tão útil para prever a resposta individual , daí a necessidade de avaliar o desempenho do modelo como um todo (por exemplo, o modelo nulo). O Nagelkerke é útil porque possui um valor máximo de 1,0, como disse Srikant. Esta é apenas uma versão normalizada do calculada a partir da razão de verossimilhança,R 2 R 2 LR = 1 - exp ( - LR / n )R2R2R2LR=1−exp(−LR/n), que tem conexão com a estatística de Wald para associação geral, conforme proposto originalmente por Cox e Snell. Outros índices de capacidade preditiva são o escore de Brier, o índice C (probabilidade de concordância ou área ROC) ou D de Somers, os dois últimos fornecendo uma melhor medida de discriminação preditiva.
As únicas suposições feitas na regressão logística são as de linearidade e aditividade (+ independência). Embora muitos testes globais de qualidade do ajuste (como o teste Hosmer & Lemeshow , mas veja meu comentário no @onestop) tenham sido propostos, eles geralmente não têm energia. Para avaliar o ajuste do modelo, é melhor confiar em critérios visuais (estimativas estratificadas, suavização não paramétrica) que ajudam a identificar a partida local ou global entre resultados previstos e observados (por exemplo, não linearidade ou interação), e isso é amplamente detalhado no RMS de Harrell apostila . Sobre um assunto relacionado (testes de calibração), Steyerberg ( Clinical Prediction Modelsχ2, 2009) aponta a mesma abordagem para avaliar a concordância entre os resultados observados e as probabilidades previstas:
A calibração está relacionada à qualidade do ajuste, que se refere à capacidade de um modelo de ajustar um determinado conjunto de dados. Normalmente, não existe um teste único de qualidade de ajuste que tenha bom poder contra todos os tipos de falta de ajuste de um modelo de previsão. Exemplos de falta de ajuste são não linearidades perdidas, interações ou uma função de link inadequada entre o preditor linear e o resultado. A qualidade do ajuste pode ser testada com uma
estatística . (p. 274)χ2
Ele também sugere confiar na diferença absoluta entre os resultados observados suavizados e as probabilidades previstas visualmente ou com a chamada estatística E de Harrell.
Mais detalhes podem ser encontrados no livro de Harrell, Regression Modeling Strategies (pp. 203-205, 230-244, 247-249). Para uma discussão mais recente, consulte também
Steyerberg, EW, Vickers, AJ, Cook, NR, Gerds, T, Gonen, M, Obuchowski, N, Pencina, MJ e Kattan, MW (2010). Avaliando o desempenho dos modelos de previsão, uma estrutura para medidas tradicionais e inovadoras . Epidemiology , 21 (1) , 128-138.