Não sei se essa é uma prática comum / melhor, mas é outro ponto de vista do assunto.
Se você tem, digamos, uma data, pode tratar cada campo como uma "variável de categoria" em vez de uma "variável contínua". O dia teria um valor no conjunto {1, 2 ..., 31}, o mês teria um valor em {1, ..., 12} e, para o ano, você escolheria um valor mínimo e um valor máximo e construa um conjunto.
Então, como os valores numéricos específicos de dias, meses e anos podem não ser úteis para encontrar tendências nos dados, use uma representação binária para codificar os valores numéricos, sendo cada bit um recurso. Por exemplo, o mês 5 seria 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 e a 1 na 5ª posição, cada bit sendo um recurso).
Assim, tendo, por exemplo, 10 anos no "conjunto do ano", uma data seria transformada em um vetor de 43 elementos (= 31 + 12 + 10). Usando "vetores esparsos", a quantidade de recursos não deve ser um problema.
Algo semelhante poderia ser feito para dados de horas, dia da semana, dia do mês ...
Tudo depende da pergunta que você deseja que seu modelo de aprendizado de máquina responda.