Qual é a melhor / maneira correta de combinar a análise de texto com outros recursos? Por exemplo, eu tenho um conjunto de dados com algum texto, mas também outros recursos / categorias. O vetorizador TF-IDF do SKlearn transforma dados de texto em matrizes esparsas. Eu posso usar essas matrizes esparsas diretamente com um classificador Naive Bayes, por exemplo. Mas como também levar em conta os outros recursos? Devo desesparsificar a representação tf-idf do texto e combinar os recursos e o texto em um DataFrame? Ou posso manter a matriz esparsa como uma coluna separada, por exemplo? Qual é a maneira correta de fazer isso?