Perguntas com a marcação «feature-selection»

Métodos e princípios de seleção de um subconjunto de atributos para uso em modelagem adicional

2
Seleção de recursos com florestas aleatórias
Eu tenho um conjunto de dados com principalmente variáveis ​​financeiras (120 recursos, exemplos de 4k) que são altamente correlacionadas e muito barulhentas (indicadores técnicos, por exemplo), então eu gostaria de selecionar cerca de 20-30 máx. Para uso posterior no treinamento de modelo (classificação binária - aumentar diminuir). Eu estava pensando …


4
Mineração de texto: como agrupar textos (por exemplo, artigos de notícias) com inteligência artificial?
Eu construí algumas redes neurais (MLP (totalmente conectadas), Elman (recorrente)) para tarefas diferentes, como jogar Pong, classificar dígitos manuscritos e outras coisas ... Além disso, tentei criar algumas primeiras redes neurais convolucionais, por exemplo, para classificar notas manuscritas de vários dígitos, mas sou completamente novo para analisar e agrupar textos, …




3
Para classificadores lineares, coeficientes maiores implicam recursos mais importantes?
Sou engenheiro de software trabalhando em aprendizado de máquina. Pelo meu entendimento, regressão linear (como OLS) e classificação linear (como regressão logística e SVM) fazem uma previsão com base em um produto interno entre coeficientes treinados variáveis ​​de recurso → x :W⃗ W→\vec{w}x⃗ x→\vec{x} y^= f( w⃗ ⋅ x⃗ ) …



1
Qual método de comparação múltipla usar para um modelo mais antigo: lsmeans ou glht?
Estou analisando um conjunto de dados usando um modelo de efeitos mistos com um efeito fixo (condição) e dois efeitos aleatórios (participante devido ao design do sujeito e ao par). O modelo foi gerado com o lme4pacote: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Em seguida, realizei um teste de razão de verossimilhança desse modelo em …



1
Qual é o algoritmo de regressão stagewise forward?
Talvez seja apenas porque estou cansada, mas estou tendo problemas para tentar entender o algoritmo Forward Stagewise Regression. Na página "Elementos da aprendizagem estatística", página 60: A regressão forward-stagewise (FS) é ainda mais restrita que a regressão forward-stepwise. Começa como regressão progressiva para a frente, com uma interceptação igual à …

1
GAM vs LOESS vs splines
Contexto : Eu quero desenhar uma linha em um gráfico de dispersão que não aparece paramétrica, portanto, eu estou usando geom_smooth()no ggplotno R. Ele retorna automaticamente, geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.