Meus dados consistem em várias medições contínuas e em algumas variáveis fictícias que representam os anos em que as medições foram feitas. Agora, quero aprender uma rede neural com os dados. Portanto, estou normalizando o zScore de todas as variáveis, incluindo as variáveis dummy. No entanto, eu me pergunto se essa é uma abordagem razoável, porque normalizar as variáveis dummy altera seus intervalos, o que acho que as torna menos comparáveis se suas distribuições diferirem. Por outro lado, não normalizar as variáveis fictícias também pode ser questionável, porque sem normalização sua influência na saída da rede pode ser abaixo do ideal.
Qual é a melhor abordagem para lidar com variáveis fictícias, normalizando-as (zScore) ou apenas deixando-as como estão?