Perguntas com a marcação «stepwise-regression»

A regressão passo a passo (geralmente chamada de regressão para frente ou para trás) envolve ajustar um modelo de regressão e adicionar ou remover preditores com base em t Estatisticas, R2ou critérios de informação para chegar de maneira * gradual * a um modelo final. Essa tag também pode ser usada para estratégias de seleção direta, eliminação reversa e melhores subconjuntos de variáveis.



2
Como funciona a "regressão gradual"?
Usei o seguinte código R para ajustar um modelo probit: p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1) stepwise(p1, direction='backward/forward', criterion='BIC') Eu quero saber o que faz stepwisee backward/forwardfaz exatamente e como selecionar as variáveis?


2
Interpretando a saída da etapa em R
Em R, o stepcomando supostamente pretende ajudá-lo a selecionar as variáveis ​​de entrada para o seu modelo, certo? O seguinte vem de example(step)#-> swiss& step(lm1) > step(lm1) Start: AIC=190.69 Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC - Examination 1 53.03 …

2
Superioridade do LASSO sobre seleção direta / eliminação retroativa em termos de erro de previsão de validação cruzada do modelo
Eu obtive três modelos reduzidos de um modelo completo original usando seleção para a frente eliminação para trás Técnica de penalização L1 (LASSO) Para os modelos obtidos usando seleção direta / eliminação reversa, obtive a estimativa validada cruzada do erro de previsão usando o CVlmpacote DAAGdisponível em R. Para o …

4
Existe uma maneira de usar a validação cruzada para fazer a seleção de variáveis ​​/ recursos no R?
Eu tenho um conjunto de dados com cerca de 70 variáveis ​​que eu gostaria de reduzir. O que estou procurando fazer é usar o CV para encontrar as variáveis ​​mais úteis da seguinte maneira. 1) Selecione aleatoriamente digamos 20 variáveis. 2) Use stepwise/ LASSO/ lars/ etc para escolher as variáveis …




1
Intervalos de confiança ao usar o teorema de Bayes
Estou computando algumas probabilidades condicionais e intervalos de confiança associados a 95%. Para muitos de meus casos, tenho contagens diretas de xsucessos fora dos ntestes (de uma tabela de contingência), para que eu possa usar um intervalo de confiança binomial, como é fornecido por binom.confint(x, n, method='exact')in R. Em outros …

3
Uma abordagem gradual produz o modelo mais alto ?
Ao usar a abordagem passo a passo para selecionar variáveis, é garantido que o modelo final tenha o maior R ^ 2 possível R2R2R^2? Dito de outra maneira, a abordagem por etapas garante um ótimo global ou apenas um ótimo local? Por exemplo, se eu tiver 10 variáveis ​​para selecionar …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.