É praticamente o que você disse. Formalmente, você pode dizer:
A variação, no contexto do Machine Learning, é um tipo de erro que ocorre devido à sensibilidade de um modelo a pequenas flutuações no conjunto de treinamento.
Uma alta variação faria com que um algoritmo modelasse o ruído no conjunto de treinamento. Isso é mais comumente referido como sobreajuste .
Ao discutir a variação no Machine Learning, também nos referimos ao viés .
A tendência, no contexto do Machine Learning, é um tipo de erro que ocorre devido a suposições errôneas no algoritmo de aprendizado.
Um viés alto faria com que um algoritmo perdesse relações relevantes entre os recursos de entrada e as saídas de destino. Às vezes, isso é chamado de falta de ajuste .
Relação entre viés e variância:
Na maioria dos casos, tentar minimizar um desses dois erros levaria ao aumento do outro. Assim, os dois são geralmente vistos como uma troca .
Causa de alto viés / variância no ML:
O fator mais comum que determina o viés / variação de um modelo é sua capacidade (pense nisso como o modelo é complexo ).
Modelos de baixa capacidade (por exemplo, regressão linear) podem perder relações relevantes entre os recursos e os alvos, causando um viés alto. Isso é evidente na figura à esquerda acima.
Por outro lado, modelos de alta capacidade (por exemplo, regressão polinomial de alto grau, redes neurais com muitos parâmetros) podem modelar parte do ruído, juntamente com quaisquer relações relevantes no conjunto de treinamento, fazendo com que tenham alta variação, como visto na figura à direita acima.
Como reduzir a variação em um modelo?
A maneira mais fácil e comum de reduzir a variação em um modelo de ML é aplicando técnicas que limitam sua capacidade efetiva, isto é, regularização .
As formas mais comuns de regularização são penalidades de norma de parâmetro , que limitam as atualizações de parâmetro durante a fase de treinamento; parada precoce , o que reduz o treinamento; poda para algoritmos baseados em árvores; desistência de redes neurais, etc.
Um modelo pode ter baixo viés e baixa variação?
Sim . Da mesma forma, um modelo pode ter alto viés e alta variação, conforme ilustrado na figura abaixo.
Como podemos alcançar baixo viés e baixa variação?
Na prática, a maioria da metodologia é:
- Selecione um algoritmo com uma capacidade alta o suficiente para modelar suficientemente o problema. Nesse estágio, queremos minimizar o viés , portanto ainda não estamos preocupados com a variação.
- Regularize o modelo acima, para minimizar sua variação .