Cálculo do intervalo de previsão

9

Eu tenho os seguintes dados localizados aqui . Estou tentando calcular o intervalo de confiança de 95% sobre a pureza média quando a porcentagem de hidrocarbonetos é 1,0. Em R, insiro o seguinte.

> predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95)
   fit      lwr      upr
1 89.66431 87.51017 91.81845

No entanto, como posso obter esse resultado pessoalmente? Eu tentei usar a seguinte equação.

s_{n e W} = \sqrt{s^{2} (1 + \frac{1}{N} + \frac{(x_{n e W} - \bar{x})^{2}}{\sum (x_{Eu} - \bar{x})^{2}})}

$s_{new}=\sqrt{s^2\left(1+\frac{1}{N}+\frac{(x_{new}-\bar x)^2}{\sum(x_i-\bar x)^2}\right)}$

E eu insiro o seguinte em R.

> SSE_line = sum((purity - (77.863 + 11.801*hydro))^2)
> MSE = SSE_line/18
> t.quantiles <- qt(c(.025, .975), 18)
> prediction = B0 + B1*1
> SE_predict = sqrt(MSE)*sqrt(1+1/20+(mean(hydro)-1)^2/sum((hydro - mean(hydro))^2))
> prediction + SE_predict*t.quantiles
[1] 81.80716 97.52146

Meus resultados são diferentes da função de previsão de R. O que estou entendendo mal sobre intervalos de previsão?

r regression confidence-interval prediction-interval

— idealistikz
fonte

Como você está calculando o MSE no seu código?

Eu adicionei o cálculo ao post.

— Idealistikz

1

como MMJ sugeriu que você deve tentarpredict(purity.lm, newdata=list(hydro=1.0), interval="prediction", level=.95)

— vinux

16

Seu predict.lmcódigo está calculando intervalos de confiança para os valores ajustados. O seu cálculo manual está calculando intervalos de previsão para novos dados. Se você deseja obter o mesmo resultado predict.lmobtido no cálculo manual, mude interval="confidence"para interval="prediction"

— MMJ
fonte

1

Boa resposta do dpel. Eu acrescentaria que a diferença entre o intervalo de confiança e o intervalo de previsão pode ser declarada como abaixo:

Intervalo de confiança

s_{n e W} = \sqrt{s^{2} (\frac{1}{N} + \frac{(x_{n e W} - \bar{x})^{2}}{\sum (x_{Eu} - \bar{x})^{2}})}

$s_{new}=\sqrt{s^2\left(\frac{1}{N}+\frac{(x_{new}-\bar x)^2}{\sum(x_i-\bar x)^2}\right)}$

Intervalo de previsão

s_{n e W} = \sqrt{s^{2} (1 + \frac{1}{N} + \frac{(x_{n e W} - \bar{x})^{2}}{\sum (x_{Eu} - \bar{x})^{2}})}

$s_{new}=\sqrt{s^2\left(1+\frac{1}{N}+\frac{(x_{new}-\bar x)^2}{\sum(x_i-\bar x)^2}\right)}$

Fonte Veja os slides das páginas 5/17 e 11/17

— lklklk
fonte