Perguntas com a marcação «rpart»

3
O que é Deviance? (especificamente em CART / rpart)
O que é "desvio", como é calculado e quais são seus usos em diferentes campos nas estatísticas? Em particular, estou pessoalmente interessado em seus usos no CART (e sua implementação no rpart no R). Estou perguntando isso, já que o artigo wiki parece um pouco ausente e suas idéias serão …
45 r  cart  rpart  deviance 

4
Como medir / classificar “importância variável” ao usar o CART? (especificamente usando {rpart} de R)
Ao construir um modelo CART (especificamente árvore de classificação) usando rpart (em R), geralmente é interessante saber qual é a importância das várias variáveis ​​introduzidas no modelo. Assim, minha pergunta é: Que medidas comuns existem para classificar / medir a importância das variáveis ​​participantes de um modelo CART? E como …

2
Escolhendo o parâmetro de complexidade no CART
Na rotina rpart () para criar modelos CART, você especifica o parâmetro de complexidade para o qual deseja remover sua árvore. Eu vi duas recomendações diferentes para escolher o parâmetro de complexidade: Escolha o parâmetro de complexidade associado ao erro mínimo possível de validação cruzada. Este método é recomendado pelo …
16 r  cart  rpart 

2
Particionando árvores em R: party vs. rpart
Já faz um tempo desde que eu olhei para particionar árvores. A última vez que fiz esse tipo de coisa, eu gosto de festa no R (criada por Hothorn). A idéia de inferência condicional via amostragem faz sentido para mim. Mas a rpart também teve apelo. No aplicativo atual (não …
15 r  cart  rpart  partitioning 




1
Por que Anova () e drop1 () forneceram respostas diferentes para os GLMMs?
Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois últimos dão as mesmas respostas. Usando um monte de dados fabricados, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 


1
Como escolher o número de divisões em rpart ()?
Eu tenho usado rpart.controlpara minsplit=2, e obteve os seguintes resultados de rpart()função. Para evitar o ajuste excessivo dos dados, preciso usar as divisões 3 ou 7? Não devo usar divisões 7? Por favor deixe-me saber. Variáveis ​​realmente usadas na construção de árvores: [1] ct_a ct_b usr_a Root node error: 23205/60 …
9 r  cart  rpart 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.