O resultado Gini = 2 * AUROC-1 é difícil de provar porque não é necessariamente verdadeiro. O artigo da Wikipedia sobre a curva Receiver Operating Characteristic fornece o resultado como uma definição de Gini, e o artigo de Hand and Till (citado por nealmcb) apenas diz que a definição gráfica de Gini usando a curva ROC leva a essa fórmula.
O problema é que essa definição de Gini é usada nas comunidades de aprendizado de máquina e engenharia, mas uma definição diferente é usada por economistas e demógrafos (voltando ao artigo original de Gini). O artigo da Wikipedia sobre o coeficiente de Gini define essa definição, com base na curva de Lorenz.
Um artigo de Schechtman & Schechtman (2016) estabelece a relação entre AUC e a definição original de Gini. Mas, para ver que eles não podem ser exatamente iguais, suponha que a proporção de eventos seja p e que tenhamos um classificador perfeito. A curva ROC passa então pelo canto superior esquerdo e o AUCROC é 1. No entanto, a curva de Lorenz (invertida) varia de (0,0) a ( p , 1) a (1,1) e o Gini dos economistas é 1 - p / 2, que é quase mas não exatamente 1.
Se os eventos são raros, o relacionamento Gini = 2 * AUROC-1 é quase verdade, mas não exatamente, usando a definição original de Gini. O relacionamento só é exatamente verdadeiro se Gini for redefinido para torná-lo verdadeiro.