Perguntas com a marcação «categorical-data»

Dados categóricos (também denominados nominais) podem assumir um número limitado de valores possíveis chamados categorias. Valores categóricos "rótulo", eles não "medem". Por favor, use a tag [ordinal-data] para tipos de dados discretos, mas ordenados.


3
variáveis ​​dummy de centralização e dimensionamento
Eu tenho um conjunto de dados que contém variáveis ​​categóricas e variáveis ​​contínuas. Fui aconselhado a transformar as variáveis ​​categóricas como variáveis ​​binárias para cada nível (por exemplo, A_level1: {0,1}, A_level2: {0,1}) - acho que alguns chamaram isso de "variáveis ​​fictícias". Com isso dito, seria enganoso centralizar e dimensionar todo …








3
Estimador de probabilidade máxima de distribuição conjunta, considerando apenas contagens marginais
Seja px,ypx,yp_{x,y} uma distribuição conjunta de duas variáveis ​​categóricas X,YX,YX,Y , com x,y∈{1,…,K}x,y∈{1,…,K}x,y\in\{1,\ldots,K\} . Digamos que nnn amostras foram retiradas dessa distribuição, mas recebemos apenas as contagens marginais, ou seja, para j=1,…,Kj=1,…,Kj=1,\ldots,K : Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j),Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j), S_j = \sum_{i=1}^{n}{\delta(X_i=l)}, T_j = \sum_{i=1}^{n}{\delta(Y_i=j)}, Qual é o estimador de máxima verossimilhança para px,ypx,yp_{x,y} , …

5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Inversão de Berry
Eu tenho um grande conjunto de dados de mercado agregados sobre as vendas de vinhos nos EUA e gostaria de estimar a demanda por determinados vinhos de alta qualidade. Estas partes de mercado foram basicamente derivadas a partir de um modelo de utilidade aleatória da forma vocêeu j t= X′j …


1


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.