Estou interessado em estimar uma taxa de risco ajustada, análoga a como se estima uma taxa de chances ajustada usando regressão logística. Alguma literatura (por exemplo, isso ) indica que o uso da regressão de Poisson com erros padrão de Huber-White é uma maneira baseada em modelo para fazer isso
Não encontrei literatura sobre como o ajuste para covariáveis contínuas afeta isso. A seguinte simulação simples demonstra que esse problema não é tão claro:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
Nesse caso, a taxa de risco real é 2, que é recuperada de forma confiável quando o efeito covariável é pequeno. Mas, quando o efeito covariável é grande, isso fica distorcido. Suponho que isso ocorra porque o efeito covariável pode empurrar contra o limite superior (1) e isso contamina a estimativa.
Procurei, mas não encontrei nenhuma literatura sobre o ajuste de covariáveis contínuas na estimativa da razão de risco ajustada. Estou ciente das seguintes postagens neste site:
- Regressão de Poisson para estimar o risco relativo de resultados binários
- Regressão de Poisson para dados binários
mas eles não respondem minha pergunta. Existem documentos sobre isso? Existem precauções conhecidas que devem ser exercidas?