A previsão de pontos e o IC são diferentes.
Para previsão de pontos, estamos melhor corrigindo o viés o máximo possível. Para o IC, o que é necessário desde o início é que a probabilidade seja igual a . Quando [ a , b ] é o IC de 95% para ln ( y 0 ) , por exemplo, [ e um , e b ] é, certamente, um IC de 95% para y 0 porque P ( um ≤ LN X ≤ b ) = P (100(1−α)%[a,b]ln(y0)[ea,eb]y0 . Portanto, seu [ e 7.1563 , e 7.2175 ] é certamente um IC válido.P(a≤lnX≤b)=P(ea≤X≤eb)[e7.1563,e7.2175]
Mas o centro desse IC não é o preditor ingênuo (exp [preditor de ]) nem o preditor corrigido de y 0 (um fator de correção multiplicado pelo preditor ingênuo) devido à desigualdade de Jensen, mas isso realmente não importa. Em alguns casos (nem sempre), você pode ser capaz de mudar o CI para [ e um - p , e b - q ] para alguns p e q para que a probabilidade ainda é de 95% e seu centro é o indicador-corrigido viés , mas não vejo sentido nisso.lny0y0[ea−p,eb−q]pq
O que você sugeriu, ou seja, não é um CI de 95%. Para ver por isso, permitir que o factor de correcção ser h (não aleatória e perfeitamente conhecido, por simplicidade), de modo que o preditor corrigido-polarização é H e θ , onde θ é o preditor imparcial de ln y 0 ( β 0 + β 2 ln x 2 + β 3 x[es2/2ea,es2/2eb]hheθθlny0 no seu exemplo). Este " h " pode ser estimada por e s 2 / 2 , por exemplo, mas enquanto que o último é aleatória, h é assumido não aleatória, de modo a tornar mais simples. Seja [ a , b ] o IC95% para ln y 0 , ou seja, P ( a ≤ ln y 0 ≤ b ) = 0,95 . Então,
P ( h e a ≤ y 0 ≤ h e b )β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P(a≤lny0≤b)=0.95
quenãoéigual a P ( a ≤ ln y 0 ≤ b ) = 0,95 , a menos que a distribuição de ln y 0 seja uniforme, o que geralmente não é.
P(hea≤y0≤heb)=P(lnh+a≤lny0≤lnh+b),
P(a≤lny0≤b)=0.95lny0
EDITAR
O acima é sobre o IC de , não de E ( y | X = x 0 ) . A pergunta original é sobre o IC para E ( y | X = x 0 ) . Deixe- E ( Y | X = x 0 ) = h exp ( x 0 β ) , que é estimado por h exp ( x 0 β )y0E(y|X=x0)E(y|X=x0)E(y|X=x0)=hexp(x0β)h^exp(x0β^). Nesse caso, acho que o método Delta é uma opção útil (veja a resposta de luchonacho).
Para ser rigoroso, precisamos da distribuição conjunta de h e β , ou para ser mais preciso, a distribuição assintótica do vetor √h^β^. Então a distribuição limite de √n−−√[(β^−β)′,h^−h]′é obtido utilizando o método delta e, em seguida, para CI dehexp(x0β)pode ser construído.n−−√[h^exp(x0β^)−hexp(x0β)]hexp(x0β)