Grosso modo, existem três fontes diferentes de erro de previsão:
- o viés do seu modelo
- a variação do seu modelo
- variação inexplicável
Não podemos fazer nada sobre o ponto 3 (exceto tentar estimar a variação inexplicável e incorporá-la em nossas densidades preditivas e intervalos de previsão). Isso nos deixa com 1 e 2.
Se você realmente tem o modelo "certo", digamos que as estimativas dos parâmetros OLS serão imparciais e terão uma variação mínima entre todos os estimadores imparciais (lineares) (eles são AZUIS). As previsões de um modelo OLS serão as melhores previsões imparciais não lineares (BLUPs). Isso soa bem.
No entanto, verifica-se que, embora tenhamos previsões imparciais e variação mínima entre todas as previsões imparciais, a variação ainda pode ser bastante grande. Mais importante, às vezes podemos introduzir "um pouco" de viés e, ao mesmo tempo, economizar "muita" variação - e, ao acertar a troca, podemos obter um erro de previsão mais baixo com um modelo tendencioso (variação menor) do que com um viés ( maior variância) um. Isso é chamado de "troca de viés e variação", e essa pergunta e suas respostas são esclarecedoras: quando um estimador tendencioso é preferível a um imparcial?
E a regularização como o laço, a regressão da cordilheira, a rede elástica e assim por diante fazem exatamente isso. Eles puxam o modelo para zero. (As abordagens bayesianas são semelhantes - elas puxam o modelo para as anteriores.) Assim, os modelos regularizados serão enviesados em comparação com os modelos não regularizados, mas também apresentam uma variação menor. Se você escolher seu direito de regularização, o resultado será uma previsão com um erro menor.
Se você procurar "regularização de troca de viés e variação" ou algo semelhante, poderá pensar um pouco. Esta apresentação, por exemplo, é útil.
λλ → ∞λλde modo que o modelo seja o modelo zero. Sempre mantenha seus quantificadores retos.) No entanto, o modelo zero também terá um viés gigante. Afinal, ele não se importa com as observações reais.
λ
(Estou escrevendo um pequeno artigo sobre isso, que espero seja bastante acessível. Adicionarei um link assim que estiver disponível.)