Perguntas com a marcação «cross-validation»

Reter repetidamente os subconjuntos dos dados durante o ajuste do modelo para quantificar o desempenho do modelo nos subconjuntos de dados retidos.



1
Como interpretar o gráfico cv.glmnet ()?
Eu executei o laço e, em seguida, validação cruzada cv<-cv.glmnet(df, df$Price, nfolds = 1500) Quando plogo cv, obtenho o seguinte: Notei também que recebo 2 lambdas diferentes: lambda.minelambda.1se Qual é a diferença entre essas lambdas? O que posso entender da plotagem acima em geral (sobre o que são esses intervalos …

3
Parada antecipada vs validação cruzada
Atualmente, estou usando a parada antecipada no meu trabalho para evitar o excesso de ajuste. Especificamente, aqueles tomados em forma de parada antecipada, mas quando? . Agora estou querendo comparar com outros algoritmos de classificação, onde parece que a validação cruzada de 10 vezes é amplamente usada. No entanto, estou …





2
Lidando com bom desempenho em dados de treinamento e validação, mas muito ruim em dados de teste
Eu tenho um problema de regressão com 5-6k variáveis. Divido meus dados em três conjuntos não sobrepostos: treinamento, validação e teste. Treino usando apenas o conjunto de treinamento e gere muitos modelos diferentes de regressão linear escolhendo um conjunto diferente de 200 variáveis ​​para cada modelo (eu tento cerca de …





2
Validação cruzada em dimensão muito alta (para selecionar o número de variáveis ​​usadas na classificação dimensional muito alta)
Minha pergunta é sobre validação cruzada quando há muito mais variáveis ​​que observações. Para fixar idéias, proponho restringir a estrutura de classificação em uma dimensão muito alta (mais recursos do que observação). Problema: Suponha que, para cada variável , você tenha uma medida de importância T [ i ] do …

3
Suporte à regressão vetorial em dados com distorção / alta curtose
Estou usando a regressão de vetores de suporte para modelar alguns dados bastante distorcidos (com alta curtose). Eu tentei modelar os dados diretamente, mas estou recebendo previsões errôneas, principalmente devido à distribuição dos dados, que é distorcida com caudas muito grossas. Tenho certeza de que alguns discrepantes (que são pontos …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.