Para usar o SVM ou a Rede Neural, ele precisa transformar (codificar) variáveis categóricas em variáveis numéricas, o método normal nesse caso é usar 0-1 valores binários com o k-ésimo valor categórico transformado em (0,0, .. ., 1,0, ... 0) (1 está na posição k-ésima). Existem outros métodos para fazer isso, especialmente quando há um grande número de valores categóricos (por exemplo, 10000), de modo que a representação 0-1 introduza um grande número de dimensões adicionais (unidades de entrada) na Rede Neural, o que não parece muito desejado ou esperado ?
Estou perguntando sobre estratégias gerais.