Estou trabalhando em um sistema de detecção de fraudes. Nesse campo, novas fraudes aparecem regularmente, de modo que novos recursos precisam ser adicionados ao modelo continuamente.
Gostaria de saber qual é a melhor maneira de lidar com isso (da perspectiva do processo de desenvolvimento)? Apenas adicionar um novo recurso ao vetor de recursos e treinar novamente o classificador parece ser uma abordagem ingênua, porque será gasto muito tempo para a reaprendizagem dos recursos antigos.
Estou pensando no caminho de treinar um classificador para cada recurso (ou alguns recursos relacionados) e depois combinar os resultados desses classificadores com um classificador geral. Existem desvantagens dessa abordagem? Como posso escolher um algoritmo para o classificador geral?