Estou ajustando uma regressão logística passo a passo em um conjunto de dados no SPSS. No procedimento, estou ajustando meu modelo a um subconjunto aleatório que é de aprox. 60% da amostra total, ou seja, cerca de 330 casos.
O que eu acho interessante é que, toda vez que faço uma nova amostragem dos meus dados, estou recebendo variáveis diferentes entrando e saindo no modelo final. Alguns preditores estão sempre presentes no modelo final, mas outros aparecem e saem dependendo da amostra.
Minha pergunta é essa. Qual a melhor forma de lidar com isto? Eu esperava ver a convergência de variáveis preditoras, mas esse não é o caso. Alguns modelos fazem muito mais sentido intuitivo do ponto de vista operacional (e seria mais fácil de explicar aos tomadores de decisão), enquanto outros ajustam os dados um pouco melhor.
Em suma, como as variáveis estão sendo trocadas, como você recomendaria lidar com a minha situação?
Muito obrigado antecipadamente.