Qual a sua opinião sobre o excesso de amostragem na classificação em geral e o algoritmo SMOTE em particular? Por que não aplicaríamos apenas uma multa / custo para ajustar o desequilíbrio nos dados da classe e qualquer custo desequilibrado dos erros? Para meus propósitos, a precisão da previsão para um conjunto futuro de unidades experimentais é a medida final.
Para referência, o documento SMOTE: http://www.jair.org/papers/paper953.html