Atualmente, estou me ensinando a fazer a classificação e, especificamente, estou analisando três métodos: máquinas de vetores de suporte, redes neurais e regressão logística. O que estou tentando entender é por que a regressão logística teria um desempenho melhor do que os outros dois.
Do meu entendimento da regressão logística, a idéia é ajustar uma função logística a todos os dados. Portanto, se meus dados são binários, todos os meus dados com o rótulo 0 devem ser mapeados para o valor 0 (ou próximo a ele) e todos os meus dados com o valor 1 devem ser mapeados para o valor 1 (ou próximo a ele). Agora, como a função logística é contínua e suave, a execução dessa regressão requer que todos os meus dados se ajustem à curva; não há maior importância aplicada aos pontos de dados próximos ao limite da decisão e todos os pontos de dados contribuem para a perda em diferentes quantidades.
No entanto, com máquinas de vetores de suporte e redes neurais, apenas os pontos de dados próximos ao limite de decisão são importantes; enquanto um ponto de dados permanecer no mesmo lado do limite de decisão, ele contribuirá com a mesma perda.
Portanto, por que a regressão logística superaria as máquinas de vetores ou redes neurais de suporte, uma vez que "desperdiça recursos" na tentativa de ajustar uma curva a muitos dados sem importância (facilmente classificáveis), em vez de focar apenas nos dados difíceis em torno da decisão fronteira?