Existe uma representação gráfica da troca de viés e variância na regressão linear?


18

Eu estou sofrendo de um apagão. Foi-me apresentada a figura a seguir para mostrar a troca de viés e variância no contexto da regressão linear:

Modelo polinomial para dados, caso simples e complexo

Percebo que nenhum dos dois modelos se encaixa bem - o "simples" não está apreciando a complexidade da relação XY e o "complexo" está apenas se ajustando demais, basicamente aprendendo os dados de treinamento de cor. No entanto, falho completamente em ver o viés e a variação nessas duas figuras. Alguém poderia me mostrar isso?

PS: A resposta à explicação intuitiva do tradeoff de variação de polarização? realmente não me ajudou, eu ficaria feliz se alguém pudesse fornecer uma abordagem diferente com base na imagem acima.

Respostas:


11

A compensação da variação de viés é baseada na quebra do erro quadrático médio:

MSE(y^)=E[yy^]2=E[yE[y^]]2+E[y^E[y^]]2

Uma maneira de ver o comércio de desvio e variação é de quais propriedades do conjunto de dados são usadas no ajuste do modelo. Para o modelo simples, se assumirmos que a regressão OLS foi usada para ajustar a linha reta, apenas 4 números serão usados ​​para ajustar a linha:

  1. A covariância da amostra entre x e y
  2. A variação da amostra de x
  3. A média da amostra de x
  4. A média da amostra de y

Portanto, qualquer gráfico que leve aos mesmos 4 números acima levará exatamente à mesma linha ajustada (10 pontos, 100 pontos, 100000000 pontos). Então, em certo sentido, é insensível à amostra específica observada. Isso significa que será "tendencioso" porque ignora efetivamente parte dos dados. Se essa parte ignorada dos dados for importante, as previsões estarão sempre em erro. Você verá isso se comparar a linha ajustada usando todos os dados com as linhas ajustadas obtidas com a remoção de um ponto de dados. Eles tendem a ser bastante estáveis.

Agora, o segundo modelo usa todos os fragmentos de dados que pode obter e ajusta os dados o mais próximo possível. Portanto, a posição exata de cada ponto de dados é importante e, portanto, você não pode mudar os dados de treinamento sem alterar o modelo ajustado como pode para o OLS. Portanto, o modelo é muito sensível ao conjunto de treinamento específico que você possui. O modelo ajustado será muito diferente se você fizer o mesmo gráfico de ponto de dados drop-one.


O viés e a variação do parâmetro do modelo estimam ou o valor de saída previsto ? Algumas pessoas me dizem que os termos viés e variação só podem ser usados ​​para descrever o parâmetro do modelo , não os dados , está certo? θ^y^θx,y
amigos estão

Eu não acho que isso seja verdade, acho que você está falando sobre previsão ( ) vs estimativa ( ). Ambos têm as noções de viés e variação - por exemplo, você tem o "AZUL" para um parâmetro de regressão e "BLUP" para prever um ponto de dados futuro. y^θ^
probabilityislogic

Para o parâmetro estimar , seu viés é , mas é desconhecido para nós, certo? Além disso, dado o conjunto de dados, não temos idéia de como deve ser o modelo verdadeiro; por exemplo, o modelo verdadeiro por trás dos dados é , mas escolhemos um modelo de regressão linear para ajustar os dados, então aqui vem o paradoxo: os parâmetros verdadeiros são , que são o objetivo que devemos tentar estimar, mas terminamos com as estimativas de , então computa ou analisa o e o ? θ^bias(θ^)=θE[θ^]θf(x)=a+bx+cx2h(x)=d+ex(a,b,c)(d,e)bias(d)bias(e)
abacate

@ loganecolss - este não é um paradoxo, pois a noção de viés existe apenas "localmente" - ou seja, com relação a um determinado modelo estatístico. O "paradoxo" existe para uma pessoa que: 1) conhece o "verdadeiro modelo" e 2) decide não usá-lo. Essa pessoa é uma idiota no meu livro. Se você não conhecer o "verdadeiro modelo", então não é um problema - a menos que você encontrou um bom modelo e decidiu não usá-lo ...
probabilityislogic

1
f(x,z1,z2,,zK)ziK
probabilityislogic

5

Para resumir com o que acho que sei de maneira não matemática:

  • viés - sua previsão ficará incorreta quando você usar o modelo simples e isso acontecerá em qualquer conjunto de dados em que você usar o modelo. Prevê-se que sua previsão esteja errada
  • variação - se você usar o modelo complexo, obterá uma previsão muito diferente com base no conjunto de dados que estiver usando

Esta página tem uma boa explicação com diagramas semelhantes aos que você postou. (Porém, eu pulei a parte superior, basta ler a parte com diagramas) http://www.aiaccess.net/English/Glossaries/GlosMod/e_gm_bias_variance.htm (o mouseover mostra uma amostra diferente, caso você não tenha notado!)


Essa é uma página interessante e boas ilustrações, mas acho-as mais confusas do que úteis, porque (a) o "viés" e a "variação" discutidos no contexto da regressão não parecem ser o viés e a variação conforme definido no início desse página e (b) não está claro que as declarações que estão sendo feitas (sobre como o viés e a variação mudam com o número de parâmetros) estão corretas.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.