Mas não é isso que queremos. Quero dizer, isso nos salva dos problemas da multicolinearidade, não é?
Sim! e não. A rede elástica é uma combinação de duas técnicas de regularização, a regularização L2 (usada na regressão de crista) e a regularização L1 (usada no LASSO).
Lasso produz modelos naturalmente esparsos, ou seja, a maioria dos coeficientes variáveis será reduzida para 0 e efetivamente excluída do modelo. Portanto, as variáveis menos significativas são reduzidas, antes de diminuir as outras, ao contrário do cume, onde todas as variáveis são reduzidas, enquanto nenhuma delas é realmente reduzida a 0.
A rede elástica usa uma combinação linear de ambas as abordagens. O caso específico mencionado por Hastie ao discutir o método foi no caso de p grande, pequeno n. O que significa: dados de alta dimensão com relativamente poucas observações. Nesse caso, o LASSO (supostamente) selecionaria apenas no máximo n variáveis, enquanto elimina todo o resto, consulte o artigo de Hastie .
Ele sempre dependerá do conjunto de dados real, mas você pode imaginar que nem sempre o limite superior do número de variáveis em seus modelos é igual ou inferior ao número de suas observações.