Tenho várias perguntas sobre a penalidade de cordilheira no contexto de mínimos quadrados:
1) A expressão sugere que a matriz de covariância de X é reduzida em direção a uma matriz diagonal, o que significa que (assumindo que as variáveis sejam padronizadas antes do procedimento) a correlação entre as variáveis de entrada será reduzida. Esta interpretação está correta?
2) Se é uma aplicação de retração, por que não é formulada nas linhas de , assumindo que de alguma forma podemos restringir lambda a [0,1] faixa com uma normalização .
3) O que pode ser uma normalização para para que possa ser restrita a um intervalo padrão como [0,1].
4) Adicionar uma constante à diagonal afetará todos os autovalores. Seria melhor atacar apenas os valores singulares ou quase singulares? Isso é equivalente à aplicação do PCA ao X e à retenção dos principais componentes N-top antes da regressão ou tem um nome diferente (já que não modifica o cálculo da covariância cruzada)?
5) Podemos regularizar a covariância cruzada, ou ela tem algum uso, significando
onde um pequeno reduzirá a covariância cruzada. Obviamente, isso reduz todos os igualmente, mas talvez exista uma maneira mais inteligente de limiar rígido / flexível, dependendo do valor de covariância.β