Acabei de ajustar uma curva logística a alguns dados falsos. Fiz os dados essencialmente uma função de etapa.
data = -------------++++++++++++++
Mas quando olho para a curva ajustada, a inclinação é muito pequena. A função que melhor minimiza a função de custo, assumindo entropia cruzada, é a função de etapa. Por que não se parece com uma função de etapa? Existe alguma regularização, L1 ou L2, feita por padrão?
penalty='none'
. scikit-learn.org/stable/whats_new.html#id15