Como interpretar o gráfico cv.glmnet ()?


8

Eu executei o laço e, em seguida, validação cruzada

cv<-cv.glmnet(df, df$Price, nfolds = 1500) 

Quando plogo cv, obtenho o seguinte: insira a descrição da imagem aqui

Notei também que recebo 2 lambdas diferentes: lambda.minelambda.1se

  • Qual é a diferença entre essas lambdas?
  • O que posso entender da plotagem acima em geral (sobre o que são esses intervalos de confiança, quais são as duas linhas pontilhadas etc.)?

Se eu mudar para nfolds=10executar a validação 10 vezes, obtenho lambda.1secoeficientes diferentes e diferentes para este lambda. Com base em que critério posso escolher o melhor para mim?



@ilanman Isso é ótimo, obrigado! Mas ainda qual lambda devo preferir? Minha intuição dizia lambda.min mas vejo que lambda.1se é geralmente sugerido ..
Jasmine

Respostas:


16

Isso não é realmente sobre estatísticas, apenas lendo a documentação.

  • λλ λ 1 s e λ λ min λ 1 s e λλminλ1seλλminλ1seλ
  • Intervalos de confiança representam estimativas de erro para a métrica de perda (pontos vermelhos). Eles são computados usando o CV. As linhas verticais mostram os locais de e . Os números na parte superior são o número de estimativas de coeficiente diferentes de zero. λ 1 s eλminλ1se
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.