Eu tenho que fazer regressão logística binária com muitas variáveis independentes. A maioria deles é binária, mas algumas das variáveis categóricas têm mais de dois níveis.
Qual é a melhor maneira de lidar com essas variáveis?
Por exemplo, para uma variável com três valores possíveis, suponho que duas variáveis fictícias devam ser criadas. Então, em um procedimento de regressão passo a passo, é melhor testar as duas variáveis fictícias ao mesmo tempo ou testá-las separadamente?
Vou usar o SPSS, mas não me lembro muito bem, então: como o SPSS lida com essa situação?
Além disso, para uma variável categórica ordinal, é bom usar variáveis fictícias que recriam a escala ordinal? (Por exemplo, utilizando três variáveis binárias para uma variável ordinal 4-estado, colocado 0-0-0
para o nível , para o nível , para o nível e para o nível , em vez de , , e para os níveis 4).2 3 41-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1