Digamos que estou construindo um modelo de regressão logística em que a variável dependente é binária e pode assumir os valores ou . Seja as variáveis independentes - existem variáveis independentes. Digamos que para a ésima variável independente, a análise bivariada mostra uma tendência em forma de U - ou seja, se eu agrupar em posições cada uma contendo um número aproximadamente igual de observações e calcular a 'taxa ruim' para cada posição - # observações em que y = 0 / total de observações em cada caixa - então recebo uma curva em U.1 x 1 , x 2 , . . . , x m m k x k 20
Minhas perguntas são:
- Posso usar diretamente como entrada ao estimar os parâmetros beta? Há alguma suposição estatística violada que possa causar erro significativo na estimativa dos parâmetros?
- É necessário 'linearizar' essa variável por meio de uma transformação (log, quadrado, produto consigo mesmo, etc.)?