Perguntas com a marcação «model-selection»

A seleção de modelos é um problema de julgar qual modelo de algum conjunto apresenta o melhor desempenho. Os métodos populares incluemR2, Critérios AIC e BIC, conjuntos de testes e validação cruzada. Até certo ponto, a seleção de recursos é um subproblema da seleção de modelos.




2
Seleção de modelo Box-Jenkins
O procedimento de seleção do modelo Box-Jenkins na análise de séries temporais começa examinando as funções de autocorrelação e autocorrelação parcial da série. Esses gráficos podem sugerir e q apropriados em um modelo ARMA ( p , q ) . O procedimento continua solicitando ao usuário que aplique os critérios …

1
logloss vs gini / auc
Treinei dois modelos (classificadores binários usando o h2o AutoML) e quero selecionar um para usar. Eu tenho os seguintes resultados: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662 as colunas auce loglosssão as métricas de validação cruzada …


2
Abordagens conflitantes para a seleção de variáveis: AIC, valores de p ou ambos?
Pelo que entendi, a seleção de variáveis ​​com base em valores-p (pelo menos no contexto de regressão) é altamente falha. Parece que a seleção de variáveis ​​com base no AIC (ou similar) também é considerada defeituosa por alguns, por razões semelhantes, embora isso pareça um pouco obscuro (por exemplo, veja …

2
Regressão linear vs. não-linear
Eu tenho um conjunto de valores xxx e yyy que são teoricamente relacionados exponencialmente: y=axby=axby = ax^b Uma maneira de obter os coeficientes é aplicando logaritmos naturais em ambos os lados e ajustando um modelo linear: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Outra maneira …

2
O que são testes de chunk?
Em resposta a uma pergunta sobre seleção de modelos na presença de multicolinearidade , Frank Harrell sugeriu : Coloque todas as variáveis ​​no modelo, mas não teste o efeito de uma variável ajustada para os efeitos das variáveis ​​concorrentes ... Os testes de chunk de variáveis ​​concorrentes são poderosos porque …


2
Entendendo os critérios AIC e Schwarz
Estou executando um modelo logístico. O conjunto de dados do modelo real tem mais de 100 variáveis, mas estou escolhendo um conjunto de dados de teste no qual existem cerca de 25 variáveis. Antes disso, eu também fiz um conjunto de dados com 8 a 9 variáveis. Me disseram que …



1
Como comparar modelos com base na AIC?
Temos dois modelos que usam o mesmo método para calcular a probabilidade do log e o AIC para um é menor que o outro. No entanto, aquele com a AIC mais baixa é muito mais difícil de interpretar. Estamos com problemas para decidir se vale a pena introduzir a dificuldade …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.