Respostas:
Muitos classificadores podem prever pontuações contínuas. Frequentemente, as pontuações contínuas são resultados intermediários que são convertidos apenas em rótulos de classe (geralmente por limite) como a última etapa da classificação. Em outros casos, por exemplo, probabilidades posteriores para a participação na classe podem ser calculadas (por exemplo, análise discriminante, regressão logística). Você pode calcular o MSE usando essas pontuações contínuas, em vez dos rótulos da classe. A vantagem disso é que você evita a perda de informações devido à dicotomização.
Quando a pontuação contínua é uma probabilidade, a métrica MSE é chamada pontuação de Brier.
No entanto, também existem problemas de classificação que são bastante problemas de regressão disfarçados. No meu campo, poderia, por exemplo, classificar os casos de acordo com o fato de a concentração de alguma substância exceder ou não um limite legal (que é um problema binário / discriminativo de duas classes). Aqui, MSE é uma escolha natural devido à natureza de regressão subjacente da tarefa.
Neste artigo, explicamos como parte de uma estrutura mais geral:
C. Beleites, R. Salzer e V. Sergo:
Validação de Modelos de Classificação Macia usando Associações Parciais de Classe: Um Conceito Estendido de Sensibilidade & Co. aplicado à Classificação de Tecidos de Astrocitoma
Chemom. Intell. Lab. Syst., 122 (2013), 12-22.
Como calcular: se você trabalha no R, uma implementação está no pacote "softclassval", http: /softclassval.r-forge.r-project.org.
Não vejo bem como ... a classificação bem-sucedida é uma variável binária (correta ou não), por isso é difícil ver o que você gostaria de comparar.
Geralmente, as classificações são medidas em indicadores como porcentagem correta, quando uma classificação que foi estimada a partir de um conjunto de treinamento é aplicada a um conjunto de testes que foi separado anteriormente.
O erro quadrático médio certamente pode ser (e é) calculado para previsões ou valores previstos de variáveis contínuas, mas acho que não para classificações.
Para estimativas de probabilidade você deseja calcular não o MSE, mas a probabilidade:
Essa probabilidade é de uma resposta binária, que é assumida como tendo uma distribuição de Bernoulli.
Se você pegar o log de e depois negar, obtém a perda logística, que é uma espécie de análogo do MSE para quando você tiver uma resposta binária. Em particular, MSE é a probabilidade de log negativa para uma resposta contínua assumida como tendo uma distribuição normal.
Tecnicamente, você pode, mas a função MSE não é convexa para classificação binária. Assim, se um modelo de classificação binária for treinado com a função Custo MSE, não há garantia de minimizar a função Custo . Além disso, o uso do MSE como uma função de custo pressupõe a distribuição gaussiana, que não é o caso da classificação binária.