Oi tenho dataframe com grandes valores categóricos acima de 1600 categorias existe alguma maneira de encontrar alternativas para que eu não tenha mais de 1600 colunas.
Encontrei este link interessante abaixo http://amunategui.github.io/feature-hashing/#sourcecode
Mas eles estão convertendo para classe / objeto que eu não quero. Quero minha saída final como um quadro de dados para poder testar com diferentes modelos de aprendizado de máquina? ou existe alguma maneira de usar a matriz genetrada para treinar outros modelos de aprendizado de máquina que não sejam regressão logística ou XGBoost?
Existe alguma maneira que eu possa implementar?