Para a regressão do laço suponha que a melhor solução (erro mínimo de teste, por exemplo) selecione k recursos, para que \ hat {\ beta} ^ {lasso} = \ left (\ hat {\ beta} _1 ^ {lasso}, \ hat {\ beta} _2 ^ {lasso}, ..., \ hat {\ beta} _k ^ {laço}, 0, ... 0 \ direita) .
Sabemos que é um estimativa tendenciosa de , por que ainda consideramos como a solução final, em vez da mais 'razoável' , em que é a estimativa LS do modelo parcial . ( indica as colunas de correspondentes aos recursos selecionados).
Em resumo, por que usamos o Lasso tanto para seleção de recursos quanto para estimativa de parâmetros, em vez de apenas para seleção de variáveis (e deixando a estimativa dos recursos selecionados para o OLS)?
(Além disso, o que significa que 'Lasso pode selecionar no máximo recursos'? é o tamanho da amostra.)