Perguntas com a marcação «caret»

Caret é um pacote R que contém um conjunto de funções que tentam otimizar o processo de criação de modelos preditivos.

1
Pacote GBM vs. Caret usando GBM
Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 …

1
Como encontrar um intervalo de previsão do GBM
Estou trabalhando com modelos GBM usando o pacote de interpolação e procurando um método para resolver os intervalos de previsão dos meus dados previstos. Eu pesquisei bastante, mas só tenho algumas idéias para encontrar intervalos de previsão para a Floresta Aleatória. Qualquer ajuda / código R seria muito apreciada!

1
O pré-processamento é necessário antes da previsão usando o FinalModel do RandomForest com pacote de interpolação?
Eu uso o pacote de intercalação para treinar um objeto randomForest com 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Depois disso, testei o randomForest em um testSet (novos dados) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) A matriz de confusão me mostra …


1
R / mgcv: Por que os produtos tensores te () e ti () produzem superfícies diferentes?
O mgcvpacote para Rpossui duas funções para ajustar as interações do produto tensorial: te()e ti(). Entendo a divisão básica do trabalho entre os dois (ajustando uma interação não linear versus decompondo essa interação em efeitos principais e uma interação). O que não entendo é o porquê te(x1, x2)e ti(x1) + …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Número de componentes principais ao pré-processar usando PCA no pacote de interpolação em R
Estou usando o caretpacote no Rtreinamento de classificadores binários SVM. Para redução de recursos, estou pré-processando com o PCA usando o recurso incorporado preProc=c("pca")ao chamar train(). Aqui estão as minhas perguntas: Como o sinal de intercalação seleciona os principais componentes? Existe um número fixo de componentes principais que está selecionado? …

2
VarImp Caret para o modelo randomForest
Estou tendo problemas para entender como a varImpfunção funciona para um modelo randomForest com o caretpacote. No exemplo abaixo, o recurso var3 recebe zero importância usando a varImpfunção de cursor , mas o modelo final randomForest subjacente tem importância diferente de zero para o recurso var3. Por que esse é …
10 r  caret  random-forest 


1
mlr comparado ao sinal de intercalação
Eu tenho usado um pouco o mlr para aprender sobre aprendizado de máquina, mas descobri recentemente sobre o sinal de intercalação. Pelo que entendi, ambos são invólucros para vários pacotes de ML, mas têm abordagens ligeiramente diferentes. Embora o mlr pareça envolver também algumas coisas do sinal de intercalação - …


2
Rede Neural: Por que não consigo me ajustar demais?
Eu tenho uma rede neural (camada única feed-forward) com a qual tento prever uma variável relacionada ao ambiente a partir de duas variáveis ​​financeiras (regressão). Eu uso a função "train" do pacote de intercalação. Eu uso o nnet()algoritmo no pacote de sinal de intercalação. Eu tenho dois preditores contínuos e …

2
Poisson xgboost com exposição
Eu estava tentando modelar uma variável dependente de contagem com exposição desigual. Glms clássicos usariam log (exposição) como deslocamento, também o gbm, mas o xgboost não permite o deslocamento até agora ... Tentando encontrar uma desvantagem neste exemplo em validação cruzada ( onde o deslocamento ocorre na regressão binomial negativa …

1
Como funciona a validação cruzada no trem (circunflexo)?
Eu li várias postagens sobre o pacote de sinal de intercalação e estou especificamente interessado na função de trem . No entanto, não tenho certeza se entendi corretamente como a função do trem funciona. Para ilustrar meus pensamentos atuais, compus um exemplo rápido. Primeiro, um especifica uma grade de parâmetros. …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.