Assim, na modelagem de texto (não supervisionada), a Alocação de Dirichlet Latente (LDA) é uma versão bayesiana da Análise Semântica Latente Probabilística (PLSA). Essencialmente, LDA = PLSA + Dirichlet anteriormente sobre seus parâmetros. Meu entendimento é que o LDA agora é o algoritmo de referência e é implementado em vários pacotes, enquanto o PLSA não deve mais ser usado.
Mas na categorização de texto (supervisionada), poderíamos fazer exatamente o mesmo para o classificador multinomial Naive Bayes e colocar um Dirichlet antes dos parâmetros. Mas acho que nunca vi alguém fazer isso, e a versão "estimativa pontual" da multinacional Naive Bayes parece ser a versão implementada na maioria dos pacotes. Há alguma razão para isso?