Como obter uma pontuação de confiança para as previsões?


Respostas:


7

Independentemente do modelo, você sempre pode usar o bootstrap não paramétrico para construir um intervalo de confiança para qualquer parâmetro, incluindo previsões (que são na verdade variáveis ​​aleatórias em si, mas são relatadas como expectativas). Aqui está o procedimento geral:

  1. Deixei N denotar o número de observações em seus dados de treinamento Xe xj denotar a observação específica cuja previsão, y^j, você deseja um IC para.
  2. Deixei K denota um número de iterações de reamostragem (deve ser 20 para um IC com cobertura 95%)
  3. Para Eu no K, desenhe um N amostras aleatórias de Xcom substituição. Denote issoXEu
  4. Treine um modelo XEu e use esse modelo para formar uma previsão sobre xj. Ligue para issoy^jEu
  5. Estimar parâmetros distributivos para y^jda sua amostra. UMA100-α O IC é dado pelo α2 e 100-α2 percentis de y^j.

11
Existe uma maneira de obter esse intervalo de confiança para um modelo que já está treinado?
Rodrigo Nader

11
Não que eu saiba. Se você fingir que seus resíduos são iid (provavelmente não estão com esses modelos), você pode estimar a distribuição dos resíduos diretamente e daí derivar intervalos de previsão. Não tenho certeza se isso atende às suas necessidades. Se você está tentando identificar quais previsões o seu modelo tem mais ou menos "certeza", isso não lhe dará isso.
David Marx

@davidmarx Por que precisamos da suposição iid? se tivermos dados de validação suficientes, não podemos considerar os erros como o parâmetro a ser estimado e criar um segundo modelo de regressão para estimar?
ihadanny
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.