Então, eu tenho brincado com SVMs e me pergunto se isso é uma boa coisa a fazer:
Eu tenho um conjunto de recursos contínuos (0 a 1) e um conjunto de recursos categóricos que converti em variáveis fictícias. Nesse caso em particular, codifico a data da medição em uma variável dummy:
Existem 3 períodos nos quais tenho dados e reservei 3 números de recursos para eles:
20: 21: 22:
Portanto, dependendo do período de origem dos dados, diferentes recursos receberão 1; os outros receberão 0.
O SVM funcionará corretamente com isso ou isso é uma coisa ruim a ser feita?
Eu uso o SVMLight e um kernel linear.