Perguntas com a marcação «categorical-encoding»

Representando variáveis ​​categóricas como conjuntos de variáveis ​​numéricas. Necessário em muitos tipos de análise para que processem dados categóricos. Um exemplo comum é usar um preditor categórico em regressão / ANOVA por meio de codificação fictícia, codificação de efeito, codificação Helmert, contrastes definidos pelo usuário, etc.



3
Como lidar com variáveis ​​categóricas não binárias em regressão logística (SPSS)
Eu tenho que fazer regressão logística binária com muitas variáveis ​​independentes. A maioria deles é binária, mas algumas das variáveis ​​categóricas têm mais de dois níveis. Qual é a melhor maneira de lidar com essas variáveis? Por exemplo, para uma variável com três valores possíveis, suponho que duas variáveis ​​fictícias …

4
Como provar estatisticamente se uma coluna possui dados categóricos ou não está usando Python
Eu tenho um quadro de dados em python, onde eu preciso encontrar todas as variáveis ​​categóricas. A verificação do tipo da coluna nem sempre funciona porque o inttipo também pode ser categórico. Portanto, busco ajuda para encontrar o método de teste de hipótese correto para identificar se uma coluna é …

1
Variável categórica de regressão linear R valor "oculto"
Este é apenas um exemplo que encontrei várias vezes, portanto não tenho dados de amostra. Executando um modelo de regressão linear em R: a.lm = lm(Y ~ x1 + x2) x1é uma variável contínua. x2é categórico e possui três valores, por exemplo, "Baixo", "Médio" e "Alto". No entanto, a saída …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



1
Codificação fictícia para contrastes: 0,1 vs. 1, -1
Estou procurando sua ajuda para entender a diferença entre dois contrastes diferentes para variáveis ​​dicotômicas. Nesta página: http://www.psychstat.missouristate.edu/multibook/mlt08.htm em "Variáveis ​​preditivas dicotômicas", existem duas maneiras de codificar preditores dicotômicos: usando o contraste 0,1 ou o contraste 1, -1 . Eu meio que entendo a distinção aqui (0,1 é codificação fictícia …

2
Por que a codificação do tratamento resulta em uma correlação entre inclinação aleatória e interceptação?
Considere um planejamento fatorial dentro do sujeito e dentro do item, onde a variável de tratamento experimental possui dois níveis (condições). Seja m1o modelo máximo e m2o modelo sem correlações aleatórias. m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition + (1|subject) + (0 + condition|subject) + …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.