Essa é uma pergunta em geral, não específica para nenhum método ou conjunto de dados. Como lidamos com um problema de desequilíbrio de classe no aprendizado de máquina supervisionado, em que o número de 0 é de cerca de 90% e o número de 1 é de cerca de 10% em seu conjunto de dados.
Uma das maneiras que sigo é a amostragem para equilibrar o conjunto de dados, treinar o classificador e repeti-lo para várias amostras.
Eu sinto que isso é aleatório. Existe alguma estrutura para abordar esse tipo de problema.