Modelos generativos versus discriminativos (no contexto bayesiano)


22

Quais são as diferenças entre os modelos generativo e discriminativo (discriminante) (no contexto da aprendizagem e inferência bayesiana)?

e o que diz respeito à previsão, teoria da decisão ou aprendizado não supervisionado?


Desculpe, não entendo o que você quer dizer com a segunda frase. Você tentaria reformulá-lo?
csgillespie

Oh, acabei de ingressar no mundo da estatística e do aprendizado de máquina. Desculpe por não descobrir como vincular o aprendizado não supervisionado à teoria da decisão. mas ainda estou estudando!
Nkint 19/11/10

1
Estou confuso como isso se encaixa na pergunta. Por exemplo, as palavras "previsão", "teoria da decisão" ou "não supervisionado" não aparecem na resposta aceita
csgillespie

Respostas:


35

Ambos são usados ​​no aprendizado supervisionado, no qual você deseja aprender uma regra que mapeia a entrada x para a saída y, dados vários exemplos de treinamento no formato . Um modelo generativo (por exemplo, Bayes ingênuo) modela explicitamente a distribuição de probabilidade conjunta p ( x , y ) e, em seguida, usa a regra de Bayes para calcular p ( y | x ) . Por outro lado, um modelo discriminativo (por exemplo, regressão logística) modela diretamente p ( y | x ) .{(xEu,yEu)}p(x,y)p(y|x)p(y|x)

(y)p(x|y)

Pode haver casos em que um modelo é melhor que o outro (por exemplo, modelos discriminativos costumam se sair melhor se você tiver muitos dados; modelos generativos podem ser melhores se você tiver alguns dados extras não rotulados). De fato, também existem modelos hybird que tentam trazer o melhor dos dois mundos. Veja este documento para um exemplo: Híbridos de princípios de modelos generativos e discriminativos


1
Boa resposta. Com relação à comparação de exemplos canônicos de classificadores discriminativos versus geradores (regressão logística e Bayes ingênuo gaussiano, respectivamente), achei este capítulo do livro muito acessível que o Ng: cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf
Josh Hemann

3

Uma adição à resposta acima:

Como os discriminantes cuidam apenas de P (Y | X), enquanto os generativos cuidam de P (X, Y) e P (X) ao mesmo tempo, para prever bem P (Y | X), o modelo generativo tem menos grau de liberdade no modelo comparado ao modelo discriminante. Portanto, o modelo generativo é mais robusto , menos propenso a sobreajuste, enquanto o discriminante é o contrário.

Isso explica a resposta acima

Pode haver casos em que um modelo é melhor que o outro (por exemplo, modelos discriminativos costumam se sair melhor se você tiver muitos dados; modelos generativos podem ser melhores se você tiver alguns dados extras não rotulados).


2
Você pode explicar o que está dizendo sobre o fato de os modelos generativos terem menos graus de liberdade? Prova? Links? Obrigado
Patrick
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.