Por que o glmnet usa descida de coordenadas para a regressão de Ridge?


7

Se bem entendi, o glmnet usa descida cíclica de coordenadas não apenas para redes de laço e elástico, mas também para regressão de Ridge.

Por que ele usa esse algoritmo, que às vezes fornece resultados ligeiramente imprecisos, quando existe de fato uma solução fácil de formulário fechado disponível?

Muito obrigado antecipadamente!


Imagine que você tem e procura e , as estimativas de regressão do cume indexadas pelo parâmetro de ajuste. Para usar o formulário fechado para encontrar após calcular , você teria que resolver um sistema linear totalmente diferente que você usou para resolver . Mas, para usar a descida de coordenadas com partidas a quente, você encontraria muito rapidamente e com eficiência . λ1λ2β^λ1ridgeβ^λ2ridgeβ^λ2β^λ1β^λ1β^λ2
user795305

métodos iterativos têm algumas vantagens em sistemas muito grandes e esparsos. portanto, mesmo em alguns casos, solução de formulário fechado disponível, ainda usamos métodos iterativos. Por exemplo, CG para resolver sistemas lineares
Haitao Du

Respostas:


7

Eu acho que isso é devido à velocidade. A descida cíclica de coordenadas não encontra a solução exata em tempo finito, mas é mais rápida, não apenas para uma grade de 's, mas também para uma única .λλ

Considere a tarefa de resolver a regressão de crista para um único , com uma matriz de dados de tamanho . Eu acredito que o tempo de execução ideal para a regressão exata da crista é se e se . Consulte Murphy, Machine Learning , seção 7.5.2 para obter uma referência.λn×pO(n2p)n<pO(np2)n>p

Com o algoritmo de descida cíclica de coordenadas, "um ciclo completo através de todas as variáveis custa operações " (p. 6, Friedman et al. 2010, https://www.jstatsoft.org/article/view/v033i01 ). Pode-se especificar um número de ciclos com para obter um tempo de execução grande-Oh mais rápido para um único . Para resolver muitos 's, o método deve gerar melhorias adicionais usando partidas quentes.pO(pN)ccmin(n,p)λλglmnet


1

Existem outros solucionadores para cume e o objetivo do solucionador glmnet é exatamente o de usar o CCD por razões de rastreabilidade e velocidade. Eles usam o mesmo código para todas as soluções elasticnet. O Elasticnet inclui cume e LASSO configurando ou como .λ1λ20

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.