Perguntas com a marcação «oversampling»


2
Classificação de teste em dados de desequilíbrio superamostrados
Estou trabalhando em dados gravemente desequilibrados. Na literatura, vários métodos são utilizados para reequilibrar os dados usando re-amostragem (super ou sub-amostragem). Duas boas abordagens são: SMOTE: Técnica de sobre-amostragem de minorias sintéticas ( SMOTE ) ADASYN: Abordagem de Amostra Sintética Adaptativa para Aprendizagem Desequilibrada ( ADASYN ) Eu implementei o …

2
Amostragem com substituição em R randomForest
A implementação randomForest não permite amostragem além do número de observações, mesmo quando amostragem com substituição. Por que é isso? Funciona bem: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) O que eu quero fazer: rf <- randomForest(Species ~ ., …

1
Sobre-amostragem com variáveis ​​categóricas
Gostaria de executar uma combinação de superamostragem e subamostragem para equilibrar meu conjunto de dados com aproximadamente 4000 clientes divididos em dois grupos, onde um dos grupos tem uma proporção de aproximadamente 15%. Examinei o SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) e o ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), mas ambos criam novas …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.