Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos reais.
Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos reais.
Respostas:
Se você estiver trabalhando no R, o tutorial de Carson Sievert sobre o uso do LDA para modelar tópicos em críticas de filmes é um excelente ponto de partida:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
Este tutorial utiliza o LDAvis, uma visualização interativa de distribuições de tópicos e palavras que podem realmente ajudar na intuição.
Além disso, embora não sejam curtas, as palestras de David M. Blei sobre modelos de tópicos são um ótimo recurso para entender o significado por trás dos parâmetros: http://videolectures.net/mlss09uk_blei_tm/
Eu recomendo este tutorial: Introdução à Modelagem de Tópicos e MALLET
Aqui estão alguns links adicionais para ajudar você a começar ...
Bons materiais introdutórios (incluindo links para trabalhos de pesquisa): http://www.cs.princeton.edu/~blei/topicmodeling.html
Programas:
Ainda mais aqui no blog Bied Estimates: Lista de Leitura de Modelos de Tópicos
Se você está procurando algo simples para começar e fácil de implementar, eu recomendaria isso.
O projeto CLARIN-D reuniu algumas boas dicas para tutoriais para modelagem de tópicos e LDA no site Coleção de materiais de ensino e aprendizagem (TeLeMaCo), hospedado pelo centro CLARIN da Universität des Saarlandes .
Sugiro tentar o tutorial Gensim do Machine Learning Plu . Ele fornecerá uma visão geral holística sobre PNL e LDA, incluindo: como pré-processar seus dados, fazer engenharia de recursos e aplicar LDA.