Princípio, sim - não tenho certeza de que essas técnicas ainda sejam chamadas de regressão logística.
Na verdade, sua pergunta pode se referir a duas extensões independentes dos classificadores comuns:
Você pode exigir que a soma de todas as associações de cada caso seja uma ("mundo fechado" = o caso usual)
ou descartar essa restrição (às vezes chamada de "classificadores de uma classe").
Isso poderia ser treinado por vários modelos independentes de LR, embora uma classe os problemas costumam ser mal colocados (essa classe vs. todos os tipos de exceções que podem estar em todas as direções) e, em seguida, o LR não é particularmente adequado.
associações parciais de classe: cada caso pertence à associação de cada classe, semelhante às associações na análise de cluster nebuloso:
Suponha que existam 3 classes A, B, C. Em seguida, uma amostra pode ser rotulado como pertencente à classe B. Isso também pode ser escrito como vetor de associação . Nesta notação, as associações parciais seriam, por exemplo, etc.∈ [ 0 , 1 ]nc l um s s e s
[ A = 0,05 , B = 0,95 , C = 0 ][ A = 0 , B = 1 , C= 0 ][ A = 0,05 , B = 0,95 , C= 0 ]
diferentes interpretações podem ser aplicadas, dependendo do problema (associações difusas ou probabilidades):
- difusa: um caso pode pertencer metade à classe A e metade à classe C: [0.5, 0, 0.5]
- probabilidade: a referência (por exemplo, um especialista em classificar amostras) tem 80% de certeza de que pertence à classe A, mas diz que existe uma chance de 20% de ser da classe C e ter certeza de que não é da classe B (0%): [0.8, 0 0,2].
- outra probabilidade: votos dos membros do painel de especialistas: 4 de 5 especialistas dizem "A", 1 diz "C": novamente [0,8, 0, 0,2]
para previsão, por exemplo, as probabilidades posteriores não são apenas possíveis, mas na verdade bastante comuns
- também é possível usar isso para treinamento
e até validação
A idéia é que, para casos limítrofes, pode não ser possível atribuí-los sem ambiguidade a uma classe.
- Se e como você deseja "endurecer" uma previsão suave (por exemplo, probabilidade posterior) em um rótulo de classe "normal" que corresponda a 100% de associação a essa classe depende inteiramente de você. Você pode até retornar o resultado "ambíguo" para probabilidades posteriores intermediárias. O que é sensato depende da sua aplicação.
Em R, por exemplo, nnet:::multinom
que faz parte do MASS, esses dados são aceitos para treinamento. Uma RNA com sigmóide logístico e sem nenhuma camada oculta é usada nos bastidores.
Eu desenvolvi o pacote softclassval
para a parte de validação.
Classificadores de uma classe são bem explicados em Richard G. Brereton: Chemometrics for Pattern Recognition, Wiley, 2009.
Apresentamos uma discussão mais detalhada das associações parciais neste artigo:
Claudia Beleites, Kathrin Geiger, Matthias Kirsch, Stephan B Sobottka, Gabriele Schackert e Reiner Salzer: classificação espectroscópica Raman de tecidos de astrocitoma: usando informações de referência suaves. Anal Bioanal Chem, 2011, vol. 400 (9), pp. 2801-2816