Esta publicação segue esta: Por que a estimativa da crista se torna melhor que a OLS adicionando uma constante à diagonal?
Aqui está a minha pergunta:
Até onde eu sei, a regularização de cume usa uma -norm (distância euclidiana). Mas por que usamos o quadrado dessa norma? (uma aplicação direta de resultaria na raiz quadrada da soma do beta ao quadrado).ℓ 2
Como comparação, não fazemos isso para o LASSO, que usa um -norm para regularizar. Mas aqui está a norma "real" (apenas a soma do quadrado dos valores absolutos beta, e não o quadrado dessa soma).ℓ 1
Alguém pode me ajudar a esclarecer?