Para um intervalo de previsão de regressão linear você ainda usa E [ Y | X ] = ^ p 0 + β 1 x para gerar o intervalo. Você também usa isso para gerar um intervalo de confiança de E [ Y | x 0 ] . Qual a diferença entre os dois?
Para um intervalo de previsão de regressão linear você ainda usa E [ Y | X ] = ^ p 0 + β 1 x para gerar o intervalo. Você também usa isso para gerar um intervalo de confiança de E [ Y | x 0 ] . Qual a diferença entre os dois?
Respostas:
A diferença entre um intervalo de previsão e um intervalo de confiança é o erro padrão.
O erro padrão para um intervalo de confiança na média leva em consideração a incerteza devido à amostragem. A linha que você calculou da sua amostra será diferente da linha que seria calculada se você tivesse toda a população, o erro padrão leva essa incerteza em consideração.
O erro padrão para um intervalo de previsão em uma observação individual leva em consideração a incerteza devido à amostragem como acima, mas também leva em consideração a variabilidade dos indivíduos em torno da média prevista. O erro padrão para o intervalo de previsão será maior que o intervalo de confiança e, portanto, o intervalo de previsão será maior que o intervalo de confiança.
Achei a seguinte explicação útil:
Intervalos de confiança informam o quão bem você determinou a média. Suponha que os dados realmente sejam amostrados aleatoriamente a partir de uma distribuição gaussiana. Se você fizer isso várias vezes e calcular um intervalo de confiança da média de cada amostra, seria de esperar que cerca de 95% desses intervalos incluíssem o valor real da média da população. O ponto principal é que o intervalo de confiança informa sobre a provável localização do verdadeiro parâmetro populacional.
Os intervalos de previsão indicam onde você pode esperar para ver o próximo ponto de dados amostrado. Suponha que os dados realmente sejam amostrados aleatoriamente a partir de uma distribuição gaussiana. Colete uma amostra de dados e calcule um intervalo de previsão. Em seguida, prove mais um valor da população. Se você fizer isso várias vezes, esperaria que o próximo valor estivesse dentro desse intervalo de previsão em 95% das amostras. O ponto principal é que o intervalo de previsão informa sobre a distribuição dos valores, não a incerteza na determinação da população significar.
Os intervalos de previsão devem ser responsáveis pela incerteza em saber o valor da média da população, além da dispersão dos dados. Portanto, um intervalo de previsão é sempre maior que um intervalo de confiança.
Uma é a previsão de uma observação futura, e a outra é uma resposta média prevista. Darei uma resposta mais detalhada para, esperançosamente, explicar a diferença e de onde ela vem, bem como como essa diferença se manifesta em intervalos mais amplos de previsão do que de confiança.
Espero que isso torne um pouco mais claro por que o intervalo de previsão é sempre maior e qual é a diferença subjacente entre os dois intervalos. Este exemplo foi adaptado de Faraway, Linear Models com R, Sec. 4.1
Resposta curta:
Um intervalo de previsão é um intervalo associado a uma variável aleatória ainda a ser observada (previsão).
Um intervalo de confiança é um intervalo associado a um parâmetro e é um conceito frequentista.
Veja aqui a resposta completa de Rob Hyndman, o criador do pacote de previsão em R.
Esta resposta é para aqueles leitores que não conseguiram entender completamente as respostas anteriores. Vamos discutir um exemplo específico. Suponha que você tente prever o peso das pessoas a partir da altura, sexo (masculino, feminino) e dieta (padrão, baixo carboidrato, vegetariano). Atualmente, existem mais de 8 bilhões de pessoas na Terra. Obviamente, você pode encontrar milhares de pessoas com a mesma altura e outros dois parâmetros, mas com pesos diferentes. Seus pesos diferem enormemente porque alguns deles têm obesidade e outros podem sofrer de fome. A maioria dessas pessoas estará em algum lugar no meio.
Uma tarefa é prever o peso médio de todas as pessoas com os mesmos valores das três variáveis explicativas. Aqui usamos o intervalo de confiança. Outro problema é prever o peso de uma pessoa específica. E não sabemos as circunstâncias vivas desse indivíduo. Aqui o intervalo de previsão deve ser usado. É centrado em torno do mesmo ponto, mas deve ser muito maior que o intervalo de confiança.