Eu tenho duas variáveis que não mostram muita correlação quando plotadas uma contra a outra, mas uma relação linear muito clara quando plotamos os logs de cada variável novamente.
Então, eu terminaria com um modelo do tipo:
Como posso interpretar esse modelo?
curve(exp(-exp(x)), from=-5, to=5)
vs curve(plogis(x), from=-5, to=5)
. A concavidade acelera. Se o risco de evento de um único encontro foi , o risco após o segundo evento deve ser e assim por diante, essa é uma forma probabilística que o logit não captura. Exposições muito altas distorceriam os resultados da regressão logística de maneira mais dramática (falsamente, de acordo com a regra de probabilidade anterior). Alguma simulação mostraria isso a você.