Considere regressão líquida elástica com glmnet
parametrização semelhante à função de perda
L=12n∥∥y−β0−Xβ∥∥2+λ(α∥β∥1+(1−α)∥β∥22/2).
Eu tenho um conjunto de dados com
n≪p (44 e 3000 respectivamente) e estou usando a validação cruzada de 11 vezes repetida para selecionar os parâmetros de regularização ideais
α e
λ . Normalmente, eu usaria o erro ao quadrado como a métrica de desempenho no conjunto de testes, por exemplo, essa métrica do tipo R ao quadrado:
euteste= 1 -∥yteste-β^0 0-Xtesteβ^∥2∥yteste-β^0 0∥2,
mas desta vez também tentei usar a métrica de correlação (observe que para o A regressão OLS regularizada, minimizando a perda de erro ao quadrado, é equivalente a maximizar a correlação):
euteste= corr(yteste,Xtesteβ^) .
É claro que essas duas métricas de desempenho não são exatamente equivalentes, mas, estranhamente, elas discordam bastante:
Observe em particular o que acontece nos alfas pequenos, por exemplo, α = 0,2 (linha verde): a correlação máxima do conjunto de testes é alcançada quando o conjunto de testes R2 cai substancialmente em comparação com o máximo. Em geral, para qualquer α , a correlação parece ser maximizada em \ lambda maior λque o erro ao quadrado.
Por que isso acontece e como lidar com isso? Qual critério deve ser preferido? Alguém encontrou esse efeito?