Gostaria de comparar dois classificadores diferentes para um problema de classificação de texto em várias classes que usa grandes conjuntos de dados de treinamento. Duvido que eu deva usar curvas ROC ou curvas de aprendizado para comparar os dois classificadores.
Por um lado, as curvas de aprendizado são úteis para decidir o tamanho do conjunto de dados de treinamento, já que é possível encontrar o tamanho do conjunto de dados no qual o classificador interrompe o aprendizado (e talvez degrada). Portanto, o melhor classificador nesse caso pode ser aquele que atinge a maior precisão com o menor tamanho de conjunto de dados.
Por outro lado, as curvas ROC permitem encontrar um ponto com o compromisso certo entre sensibilidade / especificidade. O melhor classificador nesse caso é o mais próximo da parte superior esquerda, com o TPR mais alto para qualquer FPR.
Devo usar os dois métodos de avaliação? É possível que um método com uma melhor curva de aprendizado tenha uma curva ROC pior e vice-versa?