Perguntas com a marcação «machine-learning»

Os algoritmos de aprendizado de máquina constroem um modelo dos dados de treinamento. O termo "aprendizado de máquina" é vagamente definido; inclui o que também é chamado aprendizado estatístico, aprendizado reforçado, aprendizado não supervisionado etc. SEMPRE ADICIONE UM TAG MAIS ESPECÍFICO.

1
Reconciliando árvores de regressão reforçada (BRT), modelos impulsionados generalizados (GBM) e máquina de aumento de gradiente (GBM)
Questões: Qual é a diferença (ões) entre árvores de regressão reforçada (BRT) e modelos impulsionados generalizados (GBM)? Eles podem ser usados ​​de forma intercambiável? Uma é uma forma específica da outra? Por que Ridgeway usou a frase "Generalized Boosted Regression Models" (GBM), para descrever o que Friedman havia proposto anteriormente …


1
Como encontrar e avaliar a discretização ideal para a variável contínua com o critério
Eu tenho um conjunto de dados com variável contínua e uma variável de destino binário (0 e 1). Preciso discretizar as variáveis ​​contínuas (para regressão logística) com relação à variável alvo e com a restrição de que a frequência de observação em cada intervalo seja equilibrada. Tentei algoritmos de aprendizado …






2
Agrupando dados ruidosos ou com outliers
Eu tenho dados barulhentos de duas variáveis ​​como esta. x1 <- rep(seq(0,1, 0.1), each = 3000) set.seed(123) y1 <- rep (c(0.2, 0.8, 0.3, 0.9, 0.65, 0.35,0.7,0.1,0.25, 0.3, 0.95), each = 3000) set.seed(1234) e1 = rnorm(length(x1), 0.07,0.07) set.seed(1223) e2 = rnorm(length(x1), 0.07,0.07) set.seed(1334) yn <- rnorm(20000, 0.5,0.9) set.seed(2344) xn <- rnorm(20000, …



1
Quando é uma regra de pontuação adequada uma melhor estimativa de generalização em uma configuração de classificação?
Uma abordagem típica para resolver um problema de classificação é identificar uma classe de modelos candidatos e, em seguida, executar a seleção de modelos usando algum procedimento, como validação cruzada. Normalmente, seleciona-se o modelo com a maior precisão, ou alguma função relacionada que codifica informações específicas do problema, como FβFβ\text{F}_\beta …

2
Acoplar informações de séries temporais de fontes com várias resoluções / escalas espaciais
Eu tenho muitas imagens de varredura de satélite disponíveis em diferentes sensores. Destes, os mais grossos têm uma resolução temporal muito abundante. Os rasters de média resolução tendem a ter menos datas de aquisição, mas ainda existe algum grau de informação disponível. As de resolução mais fina têm uma resolução …

1
As florestas aleatórias podem fazer muito melhor que o erro de teste de 2,8% no MNIST?
Não encontrei nenhuma literatura sobre a aplicação de florestas aleatórias no MNIST, CIFAR, STL-10, etc., então pensei em experimentá-las com o MNIST invariante, permutador . Em R , tentei: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Isso foi executado por 2 horas e ocorreu um erro de teste de 2,8%. Eu também …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.