Você não faz uma transformação de logit para fazer a variável variar de menos infinito a mais infinito? Não tenho certeza se os dados com 0 e 1 devem ser um problema. Isso está mostrando alguma mensagem de erro? A propósito, se você tiver apenas proporções, sua análise sempre sairá errada. Você precisa usar weight=argument
para glm
com o número de casos.
Se nada funcionar, você pode usar uma divisão mediana ou quartil ou qualquer ponto de corte que julgue apropriado para dividir o DV em várias categorias e, em seguida, executar uma regressão logística Ordinal. Isso pode funcionar. Tente estas coisas.
Pessoalmente, não acho que adicionar 0,001 aos zeros e retirar 0,001 dos sejam uma péssima idéia, mas há alguns problemas que serão discutidos mais adiante. Pense, por que você não adiciona e subtrai 0,000000001 (ou até mais decimais)? Isso representará melhor 0 e 1 !! Pode parecer que não faz muita diferença. Mas ele realmente faz.
Vamos ver o seguinte:
> #odds when 0 is replaced by 0.00000001
> 0.00000001/(1-0.00000001)
[1] 1e-08
> log(0.00000001/(1-0.00000001))
[1] -18.42068
> #odds when 1 is replaced by (1-0.00000001):
> (1-0.00000001)/(1-(1-0.00000001))
[1] 1e+08
> log((1-0.00000001)/(1-(1-0.00000001)))
[1] 18.42068
> #odds when 0 is replaced by 0.001
> 0.001/(1-0.001)
[1] 0.001001001
> log(0.001/(1-0.001))
[1] -6.906755
> #odds when 1 is replaced by (1-0.001):
> (1-0.001)/(1-(1-0.001))
[1] 999
> log((1-0.001)/(1-(1-0.001)))
[1] 6.906755
Então, veja, você precisa manter as probabilidades tão próximas quanto (0/1) e (1/0). Você espera que as probabilidades de log variem de menos infinito a mais infinito. Portanto, para adicionar ou subtrair, você precisa escolher uma casa decimal realmente muito longa, para que as probabilidades do log fiquem próximas ao infinito (ou muito grandes) !! A extensão que você considerará grande o suficiente depende exclusivamente de você.