(Para referência, eu estou usando o livro "Aprendizado de máquina: uma perspectiva probabilística" de Kevin P Murphy e implementando com o MATLAN - sem caixas de ferramentas)
Eu tenho um conjunto de dados com 392 amostras (linhas), cada amostra possui 8 recursos (colunas), um dos quais define a classe (ou seja, a coluna 1 dos recursos é dividida em três caixas iguais que definem as três classes - baixa, média e alta )
Estou com muita dificuldade para entender como criar um modelo de regressão logística para classificar uma amostra em uma dessas três classes.
Acabei de aprender e criar um modelo de regressão linear, onde aprendi sobre a solução de mínimos quadrados ordinários (formulário fechado) para o vetor de peso e também a solução de descida de gradiente (formulário aberto). Mas nunca implementei descida de gradiente porque meus dados foram ajustados perfeitamente com a solução OLS para vetor de peso.
Estou extremamente confuso sobre como criar um vetor de peso para a regressão logística; entendo que ele requer o uso de Gradient Descent porque não há uma solução de formulário fechado. Também li sobre o método de Newton para calcular os pesos, mas não o compreendo.
E depois de usar esses métodos para calcular pesos, como você aplica os pesos aos dados da amostra? Na regressão linear, foi simplesmente porque você multiplicou os pesos pelos recursos (e recursos de ordem superior para regressão linear de ordem superior), mas é o mesmo na regressão logística?
Além disso, até agora, meu entendimento é de que esse modelo funciona apenas para classificação binária; então, como eu faria isso em três classes?
Basicamente, minha pergunta se resume a isso:
Como exatamente você encontra o vetor de ponderação para regressão logística (usando o método de descida de gradiente ou newtons, o que for mais fácil) e como você aplica o vetor de ponderação à amostra para obter uma classificação para três classes (não apenas duas) .