Perguntas com a marcação «feature-selection»

Métodos e princípios de seleção de um subconjunto de atributos para uso em modelagem adicional

2
Diferença entre selecionar recursos com base em "regressão F" e com base em
Está comparando recursos usando F-regressiono mesmo que correlacionando recursos com o rótulo individualmente e observando o R2R2R^2 valor? Muitas vezes vi meus colegas usarem um F regression seleção de recursos em seu pipeline de aprendizado de máquina em sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Alguns me dizem - por que eles dão os mesmos …

1
Laço bayesiano vs espiga e laje
Pergunta: Quais são as vantagens / desvantagens de usar um anterior sobre o outro para a seleção de variáveis? Suponha que eu tenha a probabilidade: onde eu posso colocar qualquer um dos anteriores: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 …



2
Por que a melhor seleção de subconjunto não é preferida em comparação com o laço?
Estou lendo sobre a melhor seleção de subconjunto no livro Elementos do aprendizado estatístico. Se eu tiver 3 preditores x1,x2,x3x1,x2,x3x_1,x_2,x_3 , crio 23=823=82^3=8 subconjuntos: Subconjunto sem preditores subconjunto com o preditorx1x1x_1 subconjunto com o preditorx2x2x_2 subconjunto com preditor x3x3x_3 subconjunto com preditores x1,x2x1,x2x_1,x_2 subconjunto com preditores x1,x3x1,x3x_1,x_3 subconjunto com preditores …

2
Abordagens conflitantes para a seleção de variáveis: AIC, valores de p ou ambos?
Pelo que entendi, a seleção de variáveis ​​com base em valores-p (pelo menos no contexto de regressão) é altamente falha. Parece que a seleção de variáveis ​​com base no AIC (ou similar) também é considerada defeituosa por alguns, por razões semelhantes, embora isso pareça um pouco obscuro (por exemplo, veja …







2
Encontrando os melhores recursos nos modelos de interação
Eu tenho uma lista de proteínas com seus valores de característica. Uma tabela de amostra é assim: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Linhas são proteínas e colunas são características. Eu também tenho uma lista de proteínas que interagem também; por exemplo Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Problema : Para …


1
Na Floresta aleatória, por que um subconjunto aleatório de recursos é escolhido no nível do nó e não no nível da árvore?
Minha pergunta: Por que a floresta aleatória considera subconjuntos aleatórios de recursos para dividir no nível do nó em cada árvore, e não no nível da árvore ? Antecedentes: isso é uma questão de história. Tin Kam Ho publicado este papel na construção de "florestas de decisão", selecionando aleatoriamente um …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.