As respostas acima são boas.
Sk e w = n e ga t i v ee x a m p l e sp o s i t i v ee x a m p l e s
Com dados desequilibrados, a AUC ainda fornece um valor ilusório em torno de 0,8. No entanto, é alto devido ao FP grande, em vez do TP grande (verdadeiro positivo).
Como o exemplo abaixo,
TP=155, FN=182
FP=84049, TN=34088
Portanto, quando você usa a AUC para medir o desempenho do classificador, o problema é que o aumento da AUC não reflete realmente um classificador melhor. É apenas o efeito colateral de muitos exemplos negativos. Você pode simplesmente tentar no seu conjunto de dados.
Fβ= ( 1 + β2) ⋅ p r e c i s i o n ⋅ r e c um l l( β2⋅ p r e c i s i o n ) + r e c um l l
β
Então, minhas sugestões para dados desequilibrados são semelhantes a este post . Você também pode experimentar a tabela de decil, que pode ser construída pesquisando "Tabelas de classificação e decil dois a dois". Enquanto isso, também estou estudando esse problema e darei uma medida melhor.