Dado um conjunto de dados com resultados binários e alguma matriz preditora X \ in \ mathbb {R} ^ {n \ times p} , o modelo de regressão logística padrão estima coeficientes \ beta_ {MLE } que maximizam a probabilidade binomial. Quando X está na classificação completa, \ beta_ {MLE} é único; quando a separação perfeita não está presente, é finita.
Esse modelo de máxima verossimilhança também maximiza a AUC do ROC (também conhecida como estatística ), ou existe alguma estimativa de coeficiente que obterá uma AUC do ROC mais alta? Se é verdade que o MLE não maximiza necessariamente a AUC do ROC, outra maneira de analisar essa questão é "Existe uma alternativa à maximização da probabilidade que sempre maximizará a AUC do ROC de uma regressão logística?"
Estou assumindo que os modelos são os mesmos: não estamos adicionando ou removendo preditores em ou alterando a especificação do modelo, e estou assumindo que os modelos de maximização de probabilidade e maximização de AUC estão usando a mesma função de link.