Perguntas com a marcação «random-forest»

A floresta aleatória é um método de aprendizado de máquina baseado na combinação dos resultados de muitas árvores de decisão.



1
Em uma floresta aleatória, o maior% IncMSE é melhor ou pior?
Depois de criar um modelo de floresta aleatória (regressão) em R, a chamada rf$importancefornece duas medidas para cada variável preditora, %IncMSEe IncNodePurity. A interpretação de que variáveis ​​preditoras com %IncMSEvalores menores são mais importantes que variáveis ​​preditoras com %IncMSEvalores maiores ? Que tal para IncNodePurity?



2
Seleção de recursos com florestas aleatórias
Eu tenho um conjunto de dados com principalmente variáveis ​​financeiras (120 recursos, exemplos de 4k) que são altamente correlacionadas e muito barulhentas (indicadores técnicos, por exemplo), então eu gostaria de selecionar cerca de 20-30 máx. Para uso posterior no treinamento de modelo (classificação binária - aumentar diminuir). Eu estava pensando …




1
Pacote R para floresta aleatória ponderada? opção classwt?
Estou tentando usar a floresta aleatória para prever o resultado de um conjunto de dados extremamente desequilibrado (a taxa de classe minoritária é de apenas 1% ou até menos). Como o algoritmo tradicional de floresta aleatória minimiza a taxa de erro geral, em vez de prestar atenção especial às classes …
16 r  random-forest 






Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.