Eu estou querendo saber como rotular (marcar) frases / parágrafos / documentos com doc2vec no gensim - do ponto de vista prático.
Você precisa ter cada frase / parágrafo / documento com seu próprio rótulo exclusivo (por exemplo, "Sent_123")? Isso parece útil se você quiser dizer "quais palavras ou frases são mais semelhantes a uma única frase específica chamada" Sent_123 ".
Você pode repetir os rótulos com base no conteúdo? Por exemplo, se cada frase / parágrafo / documento é sobre um determinado item do produto (e há várias frases / parágrafos / documentos para um determinado item do produto), você pode rotular as frases com base no item e calcular a semelhança entre uma palavra ou uma frase e esse rótulo (que eu acho que seria como uma média de todas as frases relacionadas ao item do produto)?