Se você usar a regressão logística e a cross-entropy
função de custo, sua forma é convexa e haverá um único mínimo. Porém, durante a otimização, você pode encontrar pesos próximos ao ponto ideal e não exatamente no ponto ideal. Isso significa que você pode ter várias classificações que reduzem o erro e talvez configurá-lo como zero para os dados de treinamento, mas com pesos diferentes que são ligeiramente diferentes. Isso pode levar a diferentes limites de decisão. Essa abordagem é baseada em métodos estatísticos . Como é ilustrado na forma a seguir, é possível ter limites de decisão diferentes com pequenas alterações nos pesos e todos eles têm erro zero nos exemplos de treinamento.
O que SVM
faz é uma tentativa de encontrar um limite de decisão que reduz o risco de erro nos dados de teste. Ele tenta encontrar um limite de decisão que tenha a mesma distância dos pontos de limite de ambas as classes. Consequentemente, ambas as classes terão um mesmo espaço para o espaço vazio, onde não há dados. SVM
é motivado geometricamente e não estatisticamente .
Nenhum SVMs kernelizado nada mais é do que separadores lineares. Portanto, a única diferença entre uma SVM e a regressão logística é o critério para escolher o limite?
Eles são separadores lineares e se você descobrir que seu limite de decisão pode ser um hiperplano, é melhor usar um SVM
para diminuir o risco de erro nos dados de teste.
Aparentemente, o SVM escolhe o classificador de margem máxima e a regressão logística que minimizam a perda de entropia cruzada.
Sim, conforme declarado, SVM
é baseado nas propriedades geométricas dos dados, enquanto logistic regression
é baseado em abordagens estatísticas.
Nesse caso, existem situações em que o SVM teria um desempenho melhor que a regressão logística ou vice-versa?
Aparentemente, seus resultados não são muito diferentes, mas são. SVM
s são melhores para generalização 1 , 2 .