Li o artigo de Alexandru Niculescu-Mizil e Rich Caruana, " Obtendo probabilidades calibradas de impulsionar " e a discussão neste tópico. No entanto, ainda estou tendo problemas para entender e implementar a logística ou o dimensionamento de Platt para calibrar a saída do meu classificador impulsionador de várias classes (impulso suave com tocos de decisão).
Conheço um pouco os modelos lineares generalizados e acho que entendo como os métodos de logística e calibração de Platt funcionam no caso binário, mas não sei se sei como estender o método descrito no artigo para o caso de várias classes.
O classificador que estou usando gera o seguinte:
- = Número de votos que o classificador emite para a classe j na amostra i que está sendo classificada
- = Classe estimada
Neste ponto, tenho as seguintes perguntas:
P1: Preciso usar um logit multinomial para estimar probabilidades? ou ainda posso fazer isso com regressão logística (por exemplo, de um contra todos )?
P2: Como devo definir as variáveis de destino intermediárias (por exemplo, no dimensionamento de Platt) para o caso de várias classes?
P3: Entendo que isso pode pedir muito, mas alguém estaria disposto a esboçar o pseudocódigo para esse problema? (em um nível mais prático, estou interessado em uma solução no Matlab).