Como você está usando o gensim, provavelmente deve usar a implementação do doc2vec. doc2vec é uma extensão do word2vec para o nível de frase, sentença e documento. É uma extensão bastante simples, descrita aqui
http://cs.stanford.edu/~quocle/paragraph_vector.pdf
Gensim é legal porque é intuitivo, rápido e flexível. O que é ótimo é que você pode pegar as combinações de palavras pré-treinadas na página oficial word2vec e a camada syn0 do modelo Doc2Vec da gensim é exposta para que você possa propagar as combinações de palavras com esses vetores de alta qualidade!
GoogleNews-vectors-negative300.bin.gz (conforme vinculado no Código do Google )
Acho que o gensim é definitivamente a ferramenta mais fácil (e até agora, a melhor) para incorporar uma frase em um espaço vetorial.
Existem outras técnicas de sentença para vetor que não a proposta no artigo de Le & Mikolov acima. Socher e Manning, de Stanford, são certamente dois dos pesquisadores mais famosos que trabalham nesta área. O trabalho deles foi baseado no princípio da composição - a semântica da frase vem de:
1. semantics of the words
2. rules for how these words interact and combine into phrases
Eles propuseram alguns desses modelos (cada vez mais complexos) de como usar a composicionalidade para criar representações no nível de sentenças.
2011 - desdobramento do autoencoder recursivo (muito comparativamente simples. Comece aqui se estiver interessado)
2012 - rede neural de vetores matriciais
2013 - rede de tensores neurais
2015 - Árvore LSTM
seus documentos estão disponíveis em socher.org. Alguns desses modelos estão disponíveis, mas eu ainda recomendaria o doc2vec do gensim. Por um lado, o URAE 2011 não é particularmente poderoso. Além disso, ele é pré-treinado com pesos adequados para parafrasear dados de notícias. O código que ele fornece não permite que você treine novamente a rede. Você também não pode trocar em diferentes vetores de palavras, por isso não se preocupa com as incorporações pré-word2vec de Turian em 2011. Esses vetores certamente não estão no nível dos word2vec ou GloVe.
Ainda não trabalhou com o Tree LSTM, mas parece muito promissor!
tl; dr Sim, use o doc2vec do gensim. Mas existem outros métodos!