Gostaria de testar meu modelo treinado em um conjunto de dados desequilibrado. Existe algum algoritmo disponível para gerar dados sintéticos a partir de um conjunto de dados rotulado equilibrado (spam / não spam)?
Você sempre pode desequilibrar qualquer conjunto de dados simplesmente subamostrando uma classe.
—
user2974951