Além das características óbvias do classificador, como
- custo computacional,
- tipos de dados esperados de recursos / etiquetas e
- adequação a determinados tamanhos e dimensões de conjuntos de dados,
Quais são os cinco principais classificadores (ou 10, 20?) para experimentar primeiro um novo conjunto de dados sobre o qual ainda não se sabe muito (por exemplo, semântica e correlação de recursos individuais)? Normalmente, eu tento Naive Bayes, Vizinho Mais Próximo, Árvore de Decisão e SVM - embora não tenha bons motivos para essa seleção além de conhecê-los e principalmente entender como eles funcionam.
Acho que se deve escolher classificadores que cubram as abordagens gerais de classificação mais importantes . Qual seleção você recomendaria, de acordo com esse critério ou por qualquer outro motivo?
ATUALIZAÇÃO: Uma formulação alternativa para essa pergunta poderia ser: "Quais abordagens gerais de classificação existem e quais métodos específicos cobrem os mais importantes / populares / promissores?"