Intuitivamente, o laço do grupo pode ser preferido ao laço, pois fornece um meio para incorporar (um certo tipo de) informações adicionais em nossa estimativa para o verdadeiro coeficiente . Como cenário extremo, considerando o seguinte:β∗
Com , coloque S = { j : β ∗ j ≠ 0 } como suporte de β ∗ . Considere o "Oracle" estimador β = arg min β ‖ y - X β ‖ 2 2 + λ ( | S | 1 / 2 ‖ β S ‖y∼N(Xβ∗,σ2I)S={j:β∗j≠0}β∗ que é o grupo lasso com dois grupos - um o verdadeiro suporte e um complemento. Deixe λ m um x ser o menor valor de λ que faz β = 0 . Devido à natureza da penalidade do laço do grupo, sabemos que em λ se move de λ m a x para λ m a x - ϵ
β^=argminβ∥y−Xβ∥22+λ(|S|1/2∥βS∥2+(p−|S|)1/2∥βSC∥2),
λmaxλβ^=0λλmaxλmax−ϵ(para alguns pequenos
), exactamente um grupo entrará em suporte de
β , que é popularmente considerado como uma estimativa para
S . Devido ao nosso agrupamento, com alta probabilidade, o grupo selecionado será
S , e teremos feito um trabalho perfeito.
ϵ>0β^SS
Na prática, não selecionamos os grupos tão bem. No entanto, os grupos, apesar de serem mais refinados do que o cenário extremo acima, ainda nos ajudarão: a escolha ainda seria feita entre um grupo de covariáveis verdadeiras e um grupo de covariáveis falsas. Ainda estamos pegando força emprestada.
Isso é formalizado aqui . Eles mostram, sob algumas condições, que o limite superior do erro de previsão do laço do grupo é menor que o limite inferior do erro de previsão do laço simples. Ou seja, eles provaram que o agrupamento melhora nossa estimativa.
L(β)=∥y−Xβ∥22J(β)=∑g∈G|g|1/2∥βg∥2
(∇2L(β^)+λ∇2J(β^))−1∇J(β^)
J