Voltar a transformar os resultados da regressão ao modelar o log (y)

Estou ajustando uma regressão no . É válido retroceder estimativas de ponto de transformação (e intervalos de confiança / previsão) por exponenciação? Eu não acredito nisso, já que mas queria a opinião dos outros. $\log(y)$ $E[f(X)] \ne f(E[X])$

Meu exemplo abaixo mostra conflitos com a transformação traseira (.239 vs .219).

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

regression back-transformation

— Glen
fonte

Esse não é um dos problemas resolvidos pelos GLMs gaussianos vinculados a log?

— generic_user 16/09

@ARM Sim, acredito que sim. Obrigado por apontar isso. No entanto, usando o GLM, é mais difícil obter intervalos de previsão, mas acho que posso resolver isso.

— Glen

@Glen Faça uma pesquisa por Duan smearing neste site.

— Dimitriy V. Masterov

Depende do que você deseja obter no outro extremo.

Um intervalo de confiança para um parâmetro transformado se transforma muito bem. Se tiver a cobertura nominal na escala logarítmica, ela terá a mesma cobertura na escala original, devido à monotonicidade da transformação.

Um intervalo de previsão para uma observação futura também se transforma muito bem.

Um intervalo para uma média na escala de log geralmente não será um intervalo adequado para a média na escala original.

No entanto, às vezes você pode exatamente ou aproximadamente produzir uma estimativa razoável para a média na escala original a partir do modelo na escala logarítmica.

No entanto, é necessário cuidado ou você pode acabar produzindo estimativas que possuem propriedades um tanto surpreendentes (é possível produzir estimativas que não possuem uma média populacional, por exemplo; essa não é a idéia de todo mundo de uma coisa boa).

$\exp(\mu_i)$ $\exp(\mu_i+\frac{1}{2}\sigma^2)$ $\exp(\hat{\mu_i})$ $\exp(\frac{1}{2}\sigma^2)$

$\sigma^2$

$\hat{\sigma}^2$ $\sigma^2$ $\exp(\hat{\mu_i})\cdot \exp(\frac{1}{2}\hat{\sigma}^2)$ $\exp(\hat{\mu_i})\cdot \exp(\frac{1}{2}\sigma^2)$ $\hat{\mu_i}$ $\mu_i$ $\exp(\hat{\mu_i})$ $\exp(\mu_i)$

Veja aqui .

Algumas postagens relacionadas:

Transformação posterior de um modelo MLR

Voltar Transformação

Intervalos de confiança transformados de volta

— Glen_b -Reinstate Monica
fonte

Obrigado, olhei para as postagens anteriores e, apesar de esclarecedor, ainda estava um pouco confuso, daí a minha pergunta.

— Glen

\frac{1}{2}

$\frac{1}{2}$

\hat{σ^{2}}

$\hat{\sigma^2}$

E (Y) = \int_{0}^{\infty} y f (y) d y

$E(Y) = \int_0^\infty y\, f(y)\, dy$

f

$f$

E (e^{X})

$E(e^X)$

X = \log Y

$X=\log Y$

X

$X$

Y

$Y$

t

$t$

1, 2, . . .

$1,2,...$

e^{x}

$e^x$

e^{t x}

$e^{tx}$

e^{. . .}

$e^{...}$

x

$x$

\frac{1}{2}

$\frac12$

t

$t$

e^{μ t + \frac{1}{2} σ^{2} t^{2}}

$e^{\mu t + \frac12 \sigma^2t^2}$