Eu sou novo no aprendizado de máquina e tento usar o scikit-learn (sklearn) para lidar com um problema de classificação. O DecisionTree e o SVM podem treinar um classificador para esse problema.
Uso sklearn.ensemble.RandomForestClassifier
e sklearn.svm.SVC
ajusto os mesmos dados de treinamento (cerca de 500.000 entradas com 50 recursos por entrada). O RandomForestClassifier sai com um classificador em cerca de um minuto. O SVC usa mais de 24 horas e continua funcionando.
Por que o SVC funciona tão ineficientemente? O conjunto de dados é muito grande para o SVC ? O SVC é impróprio para esse problema?