Como explicação alternativa, considere a seguinte intuição:
Ao minimizar um erro, devemos decidir como penalizar esses erros. De fato, a abordagem mais direta para penalizar erros seria usar uma linearly proportional
função de penalidade. Com essa função, cada desvio da média recebe um erro proporcional correspondente. O dobro da média resultaria em duas vezes a penalidade.
A abordagem mais comum é considerar uma squared proportional
relação entre desvios da média e a penalidade correspondente. Isso garantirá que quanto mais você estiver longe da média, mais proporcionalmente será penalizado. Usando esta função de penalidade, os valores extremos (longe da média) são considerados proporcionalmente mais informativos do que as observações próximas à média.
Para dar uma visualização disso, você pode simplesmente plotar as funções de penalidade:
Agora, especialmente ao considerar a estimativa de regressões (por exemplo, OLS), diferentes funções de penalidade produzirão resultados diferentes. Usando a linearly proportional
função de penalidade, a regressão atribuirá menos peso aos valores discrepantes do que ao usar a squared proportional
função de penalidade. O desvio médio absoluto (MAD) é, portanto, conhecido por ser um estimador mais robusto . Em geral, é, portanto, o caso de um estimador robusto que ajusta bem a maioria dos pontos de dados, mas 'ignora' os outliers. Um mínimo de quadrados, em comparação, é puxado mais para os valores extremos. Aqui está uma visualização para comparação:
Agora, embora o OLS seja praticamente o padrão, diferentes funções de penalidade também estão em uso. Como exemplo, você pode dar uma olhada na função de ajuste robusto do Matlab, que permite escolher uma função de penalidade diferente (também chamada de 'peso') para sua regressão. As funções de penalidade incluem andrews, bisquare, cauchy, fair, huber, logistic, ols, talwar e welsch. Suas expressões correspondentes também podem ser encontradas no site.
Espero que ajude você a obter um pouco mais de intuição para as funções de penalidade :)
Atualizar
Se você possui o Matlab, recomendo jogar com o robustdemo do Matlab , que foi construído especificamente para a comparação de mínimos quadrados comuns e regressão robusta:
A demonstração permite que você arraste pontos individuais e veja imediatamente o impacto nos mínimos quadrados comuns e na regressão robusta (o que é perfeito para fins de ensino!).