Respostas:
e compare os valores ajustados do modelo com as realizações reais. No entanto, esse procedimento é conhecido por desenhar uma imagem excessivamente otimista da capacidade de previsão do modelo, uma vez que algoritmos comuns de ajuste (por exemplo, usando critérios de erro ao quadrado ou de probabilidade) tendem a se esforçar para evitar grandes erros de previsão e, portanto, são suscetíveis de sobreajuste - ruído incorreto para sinal nos dados.
Uma verdadeira análise fora da amostra seria estimar o modelo com base nos dados até hoje, e construir uma previsão do valor de amanhã , aguarde até amanhã, registre o erro de previsão re-estimate the model, make a new forecast of , and so forth. At the end of this exercise, one would have a sample of forecast errors which would be truly out-of-sample and would give a very realistic picture of the model's performance.
Since this procedure is very time-consuming, people often resort to "pseudo", or "simulated", out-of-sample analysis, which means to mimic the procedure described in the last paragraph, using some historical date , rather than today's date , as a starting point. The resulting forecasting errors are then used to get an estimate of the model's out-of-sample forecasting ability.
Note that pseudo-out-of-sample analysis is not the only way to estimate a model's out-of-sample performance. Alternatives include cross-validation and information criteria.
A very good discussion of all these issues is provided in Chapter 7 of
http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf