Respostas:
Ao fazer a regressão logística, você recebe duas classes codificadas como e 0 . Agora, você calcula as probabilidades de que, dadas algumas variáveis explicativas, um indivíduo pertença à classe codificada como 1 . Se você agora escolher um limite de probabilidade e classificar todos os indivíduos com uma probabilidade maior que esse limite como classe 1 e abaixo como 0, na maioria dos casos, você cometerá alguns erros, porque geralmente dois grupos não podem ser discriminados perfeitamente. Para esse limite, agora você pode calcular seus erros e a chamada sensibilidade e especificidade. Se você fizer isso para muitos limites, poderá construir uma curva ROC plotando a sensibilidade contra a Especificidade 1 para muitos limites possíveis. A área sob a curva entra em jogo se você quiser comparar diferentes métodos que tentam discriminar entre duas classes, por exemplo, análise discriminante ou um modelo probit. Você pode construir a curva ROC para todos esses modelos e aquele com a área mais alta abaixo da curva pode ser visto como o melhor modelo.
Se você precisar obter uma compreensão mais profunda, também poderá ler a resposta de uma pergunta diferente sobre as curvas ROC clicando aqui.
O modelo de regressão logística é um método de estimativa de probabilidade direta. A classificação não deve desempenhar nenhum papel em seu uso. Qualquer classificação não baseada na avaliação de serviços públicos (função de perda / custo) em assuntos individuais é inadequada, exceto em emergências muito especiais. A curva ROC não é útil aqui; nem a sensibilidade ou a especificidade que, como a precisão geral da classificação, são regras inadequadas de pontuação de precisão que são otimizadas por um modelo falso que não é ajustado pela estimativa da probabilidade máxima.
Eu não sou o autor deste blog e achei este blog extremamente útil: http://fouryears.eu/2011/10/12/roc-area-under-the-curve-explained
Aplicando esta explicação aos seus dados, o exemplo positivo médio tem cerca de 10% dos exemplos negativos com pontuação mais alta.