Perguntas com a marcação «feature-selection»

Métodos e princípios de seleção de um subconjunto de atributos para uso em modelagem adicional

2
É errado escolher recursos com base no valor-p?
Existem várias postagens sobre como selecionar recursos. Um dos métodos descreve a importância do recurso com base nas estatísticas t. Em R varImp(model)aplicado no modelo linear com características padronizadas , o valor absoluto da estatística t para cada parâmetro do modelo é usado. Então, basicamente escolhemos um recurso com base …




2
Por que aumentar o número de recursos reduz o desempenho?
Estou tentando obter uma intuição de por que aumentar o número de recursos pode reduzir o desempenho. Atualmente, estou usando um classificador LDA que apresenta melhor desempenho bivariado entre certos recursos, mas pior ao analisar mais recursos. Minha precisão de classificação é realizada usando um xval estratificado de 10 vezes. …


1



5
Posso usar o PCA para fazer a seleção de variáveis ​​para análise de cluster?
Eu tenho que reduzir o número de variáveis ​​para realizar uma análise de cluster. Minhas variáveis ​​estão fortemente correlacionadas, então pensei em fazer uma Análise Fatorial PCA (análise de componentes principais). No entanto, se eu usar as pontuações resultantes, meus clusters não estão muito corretos (em comparação com classificações anteriores …

4
Como aplicar o método IRLS (Ireitative Squee Squared Squares) ao modelo LASSO?
Programei uma regressão logística usando o algoritmo IRLS . Gostaria de aplicar uma penalização do LASSO para selecionar automaticamente os recursos corretos. A cada iteração, o seguinte é resolvido: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Seja λλ\lambda um número real não negativo. Não estou penalizando a interceptação, como sugerido em Os elementos de. Aprendizagem …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.