Estou conduzindo uma regressão logística com um resultado binário (iniciar e não iniciar). Minha mistura de preditores são todas variáveis contínuas ou dicotômicas.
Usando a abordagem Box-Tidwell, um dos meus preditores contínuos viola potencialmente a suposição de linearidade do logit. Não há indicação de que as estatísticas de qualidade de ajuste sejam problemáticas.
Posteriormente, executei o modelo de regressão novamente, substituindo a variável contínua original por: primeiro, uma transformação de raiz quadrada e, segundo, uma versão dicotômica da variável.
Na inspeção do produto, parece que a qualidade do ajuste melhora marginalmente, mas os resíduos se tornam problemáticos. Estimativas de parâmetros, erros padrão e permanecem relativamente semelhantes. A interpretação dos dados não muda em termos de minha hipótese, nos três modelos.
Portanto, em termos de utilidade dos meus resultados e senso de interpretação dos dados, parece apropriado relatar o modelo de regressão usando a variável contínua original.
Eu estou querendo saber isso:
- Quando a regressão logística é robusta contra a possível violação da linearidade da suposição de logit?
- Dado o meu exemplo acima, parece aceitável incluir a variável contínua original no modelo?
- Existem referências ou guias para recomendar quando é satisfatório aceitar que o modelo é robusto contra a possível violação da linearidade do logit?