Eu tenho um conjunto de dados que contém variáveis categóricas e variáveis contínuas. Fui aconselhado a transformar as variáveis categóricas como variáveis binárias para cada nível (por exemplo, A_level1: {0,1}, A_level2: {0,1}) - acho que alguns chamaram isso de "variáveis fictícias".
Com isso dito, seria enganoso centralizar e dimensionar todo o conjunto de dados com as novas variáveis? Parece que eu perderia o significado "on / off" das variáveis.
Se for enganoso, isso significa que devo centralizar e dimensionar as variáveis contínuas separadamente e depois adicioná-las novamente ao meu conjunto de dados?
TIA.