Eu tenho dados brutos que possuem cerca de 20 colunas (20 recursos). Dez deles são dados contínuos e 10 deles são categóricos. Alguns dos dados categóricos podem ter 50 valores diferentes (Estados dos EUA). Depois que eu pré-processo os dados, as 10 colunas contínuas se tornam 10 colunas preparadas e os 10 valores categóricos se tornam como 200 variáveis codificadas um a quente. Estou preocupado que, se eu colocar todos esses recursos 200 + 10 = 210 na rede neural, os recursos 200-um-quentes (as 10 colunas categóricas) dominarão totalmente os 10 recursos contínuos.
Talvez um método seja "agrupar" colunas ou algo assim. Essa é uma preocupação válida e existe alguma maneira padrão de lidar com esse problema?
(Estou usando o Keras, embora não ache que isso importe muito.)