Perguntas com a marcação «unbalanced-classes»

Os dados organizados em categorias discretas ou * classes * podem apresentar problemas para certas análises se o número de observações ( ) pertencentes a cada classe não for constante entre as classes. Classes com desigual são * desequilibradas *. nn


5
Quando os dados desequilibrados são realmente um problema no Machine Learning?
Já tínhamos várias perguntas sobre dados desequilibrados ao usar regressão logística , SVM , árvores de decisão , empacotamento e várias outras perguntas semelhantes, o que o torna um tópico muito popular! Infelizmente, cada uma das perguntas parece ser específica do algoritmo e não encontrei nenhuma orientação geral para lidar …











2
Como lidar com a diferença entre a distribuição do conjunto de teste e o conjunto de treinamento?
Penso que uma suposição básica de aprendizado de máquina ou estimativa de parâmetros é que os dados invisíveis vêm da mesma distribuição que o conjunto de treinamento. No entanto, em alguns casos práticos, a distribuição do conjunto de testes será quase diferente do conjunto de treinamento. Digamos um problema de …

3
Métricas de classificação / avaliação para dados altamente desequilibrados
Eu lido com um problema de detecção de fraude (como pontuação de crédito). Como tal, existe uma relação altamente desequilibrada entre observações fraudulentas e não fraudulentas. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html fornece uma excelente visão geral das diferentes métricas de classificação. Precision and Recallou kappaambos parecem ser uma boa escolha: Uma maneira de justificar …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.