Treinei dois modelos (classificadores binários usando o h2o AutoML) e quero selecionar um para usar. Eu tenho os seguintes resultados:
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
as colunas auce loglosssão as métricas de validação cruzada (a validação cruzada usa apenas os dados de treinamento). as métricas ..._traine ..._validsão encontradas executando as métricas de treinamento e validação nos modelos, respectivamente. Eu quero usar o logloss_validou o gini_validpara escolher o melhor modelo.
O modelo 1 tem um gini melhor (ou seja, uma AUC melhor), mas o modelo dois tem um logloss melhor. Minha pergunta é qual escolher, o que eu acho que implora a pergunta, quais são as vantagens / desvantagens de usar gini (AUC) ou logloss como métrica de decisão.