Intervalo de previsão para

Vamos supor que temos regressão linear com a variável dependente . Como encontrar um intervalo de previsão para ? $ln(y)$ $E(y|X_0)$

Se tivermos , há uma maneira para atingir ? $PI(E(ln(y)|X_0))$ $PI(E(y|X_0))$

Qualquer ajuda seria apreciada.

econometrics prediction

— Um velho no mar.
fonte

Isso deveria ter sido publicado no Cross Validated, porque não há nada econômico específico, é uma questão puramente estatística.

— Richard Hardy

@RichardHardy Eu discordo. Muitos modelos lineares são escritos com ln (y) porque estamos interessados em elasticidades, e também estamos interessados em encontrar IC ou PI para o y, não o ln (y) ...

— Um homem velho no mar.

Tudo bem, nesse sentido, está relacionado à economia. Mas, ainda assim, é uma pergunta perfeitamente estatística, na medida em que me surpreende vê-lo em qualquer outro site do Stack Exchange que não seja o Validado pela Cruz. Não que eu tenha interesse particular em um site ou em outro (eu mantenho o controle de ambos), mas acho que mais consistência seria legal.

— Richard Hardy

@ Richardhardard Se você sabe como, pode sugerir que você mova essa pergunta. Vou deixar de ver a importância de um IC ou PI para ay quando o modelo está em ln (y), em um cenário estatístico. Mas para mim, de qualquer maneira, está bem. Além disso, esta questão está vinculada à minha anterior. Eles são bastante relacionados.

— Um velho no mar.

Suponho que o outro se encaixaria melhor no Cross Validated do que no Economics Stack Exchange. Mas como você recebeu e aceitou respostas para os dois, provavelmente é tarde demais para movê-los.

— Richard Hardy

Respostas:

Eu peguei esse link no Journal of Statistics Education

$X\sim \log N(\mu,\sigma^2)$ $Y=\log(X) \sim N(\mu,\sigma^2)$

$E(X)=E(e^Y)=e^{\mu+\sigma^2/2}$ $\log(E(X))$

\bar{Y} + \frac{S_{Y}^{2}}{2}

$\bar Y+\frac{S_Y^2}{2}$

V a r (\hat{\log} (E (X))) = \frac{σ^{2}}{n} + \frac{σ^{4}}{2 (n - 1)}

$Var(\hat\log(E(X)))=\frac{\sigma^2}{n}+\frac{\sigma^4}{2(n-1)}$

\hat{V} a r (\hat{\log} (E (X))) = \frac{S_{Y}^{2}}{n} + \frac{S_{Y}^{4}}{2 (n - 1)}

$\hat Var(\hat\log(E(X)))=\frac{S_Y^2}{n}+\frac{S_Y^4}{2(n-1)}$

\frac{\hat{\log} E (X) - \log E (X)}{\sqrt{\hat{V} a r (\hat{\log} (E (X)))}} \sim^{a} N (0, 1)

$\frac{\hat \log E(X)-\log E(X)}{\sqrt{\hat Var(\hat\log(E(X)))}}\sim^a N(0,1)$

C I (E (X)) =] e^{\bar{Y} + \frac{S_{Y}^{2}}{2} \pm z_{1 - α} \sqrt{\frac{S_{Y}^{2}}{n} + \frac{S_{Y}^{4}}{2 (n - 1)}}} [

$CI(E(X))=\left]e^{\bar Y+\frac{S_Y^2}{2}\pm z_{1-\alpha}\sqrt{\frac{S_Y^2}{n}+\frac{S_Y^4}{2(n-1)}}}\right[$

t (n)

$t(n)$

Se olharmos para a tabela 5 do link, podemos ver que o melhor método é o Cox modificado, pois para amostras pequenas e grandes, a probabilidade de cobertura é a mais próxima do nível nominal.

$CI(E(X))=\left]e^{\bar Y+\frac{1}{2}\frac{S_X^2}{(\bar X)^2}\pm t_{1-\alpha}\sqrt{\frac{S_Y^2}{n}}}\right[$

Simulei sua resposta com o seguinte código no Mathematica:

sim[n_] := Module[{},
  ct = 1;
  res = 0;
  While[ct <= 10000,
   data = RandomVariate[LogNormalDistribution[5, 1], n];
   y = Log[data];
   my = Mean[y];
   s2y = Variance[y];
   mx = Mean[data];
   s2x = Variance[data];
   qt = Quantile[StudentTDistribution[n], 0.975];
   If[E^(my + 0.5*s2x/mx^2 - qt*Sqrt[s2y/n]) < E^(5 + 0.5) < 
     E^(my + 0.5*s2x/mx^2 + qt*Sqrt[s2y/n]),
    res++];
   ct++;
   ];
  res = res/10000.
  ]

A única diferença é que eu fiz 10000 replicações, enquanto o link faz apenas 1000.

0.8954, 0.8464, 0.7682, 0.7153, 0.6454, 0.4832, 0.3045, 0.073, 0.0068

${0.8954, 0.8464, 0.7682, 0.7153, 0.6454, 0.4832, 0.3045, 0.073, 0.0068}$

Como podemos ver, a correção aumenta as probabilidades de cobertura quando comparada ao método ingênuo, mas ainda sofre do mesmo problema, ou seja, o prob. tendem a zero à medida que o tamanho da amostra aumenta.

Em suma, o melhor curso de ação é usar a abordagem de Cox modificada.

— Um velho no mar.
fonte

Entendo que essa abordagem aprimora as coisas especificamente para a distribuição log-normal. Minha resposta fornece um termo de correção geral e, portanto, não é surpreendente que ele dê resultados inferiores.

— Alecos Papadopoulos

Devido à desigualdade de Jensen, temos

E (\ln y) \leq \ln E (y) ⟹ \exp {E (\ln y)} \leq E (y)

$E(\ln y) \leq \ln E(y) \implies \exp\{E(\ln y)\} \leq E(y)$

$\exp\{E(\ln y)\}$ $E(y)$

$E(\ln y)$ $E(y)$

E (\ln y) \approx E [\ln E (y) + \frac{y - E (y)}{E (y)} - \frac{1}{2} \frac{[y - E (y)]^{2}}{[E (y)]^{2}}]

$E(\ln y) \approx E\left[ \ln E(y) + \frac{y-E(y)}{E(y)}-\frac 12 \frac {[y-E(y)]^2}{[E(y)]^2}\right]$

⟹ E (\ln y) \approx \ln E (y) - \frac{1}{2} \frac{σ_{y}^{2}}{μ_{y}^{2}}

$\implies E(\ln y) \approx \ln E(y) -\frac 12 \frac {\sigma_y^2}{\mu_y^2}$

⟹ \ln E (y) \approx E (\ln y) + \frac{1}{2} \frac{σ_{y}^{2}}{μ_{y}^{2}}

$\implies \ln E(y) \approx E(\ln y) +\frac 12 \frac {\sigma_y^2}{\mu_y^2}$

a correção é metade do coeficiente de variação ao quadrado .

$y$

— Alecos Papadopoulos
fonte

Alecos, obrigado pela resposta. Eu ainda tenho algumas dúvidas. Por que o IC é alterado apenas e não compactado nem distendido?

— Um velho no mar.

@Anoldmaninthesea. Eu adicionei o esclarecimento sobre o assunto.

— Alecos Papadopoulos

Vou ler sua resposta durante este fim de semana. Obrigado. Provavelmente, também examinarei a distribuição lognormal para tentar encontrar um IC exato. ;)

— Um velho no mar.

Alecos, li sua resposta e escrevi outra com uma avaliação sua. Poderia me dar algum feedback? eu apreciaria muito isso. ;)

— Um velho no mar.