Vamos dar um exemplo simples de identificação de bom tomate a partir de uma piscina de bom e ruim tomate. Digamos que o número de tomates bons seja 100 e o tomate ruim seja 1000, totalizando 1100. Agora, seu trabalho é identificar o maior número possível de tomates bons. Uma maneira de obter um bom tomate é tomar todos os 1100 tomates. Mas diz claramente que você não é capaz de diferenciar b / n bom versus ruim .
Então, qual é a maneira correta de diferenciar - precisamos obter o máximo de bons e, ao mesmo tempo, escolher muito poucos , então precisamos de uma medida, que possa dizer quantos bons escolhemos e também dizer o que os maus contam isto. A medida da AUC dá mais peso se for possível selecionar mais boas com poucas más, como mostrado abaixo. que diz quão bom você é capaz de diferenciar b / n bom e ruim.
No exemplo, você pode observar que, ao pegar 70% de tomate bom, a curva preta capta cerca de 48% dos ruins (impureza), mas a azul tem 83% dos ruins (impureza). Portanto, a curva preta tem melhor pontuação na AUC em comparação com a azul.