Eu recomendaria usar um valor diferente do parâmetro de regularização C para exemplos da classe positiva e exemplos da classe negativa (muitos pacotes SVM suportam isso e, em qualquer caso, são facilmente implementados). Em seguida, use, por exemplo, validação cruzada para encontrar bons valores dos dois parâmetros de regularização.
Pode-se mostrar que isso é re-amostragem assintoticamente equivalente dos dados em uma proporção determinada por C + e C- (portanto, não há vantagem em re-amostrar, em vez de pesar novamente, eles têm a mesma coisa no final e nos pesos pode ser contínuo, e não discreto, por isso oferece um controle mais preciso).
Não basta escolher C + e C- para atribuir uma ponderação de 50 a 50 aos padrões positivos e negativos, pois a força do efeito do problema das "classes de desequilíbrios" variará de conjunto de dados para conjunto de dados; A ponderação não pode ser determinada a priori.
Lembre-se também de que os custos falso-positivos e falso-negativos podem ser diferentes, e o problema pode se resolver se estes forem incluídos na determinação de C + e C-.
Também é importante ter em mente que, para alguns problemas, a regra de decisão ideal de Bayes atribui todos os padrões a uma única classe e ignora a outra, de modo que não é necessariamente uma coisa ruim - pode significar apenas que a densidade dos padrões de uma classe está em toda parte abaixo da densidade de padrões da outra classe.