Perguntas com a marcação «normalization»

Normalmente, "normalização" significa re-expressar dados para fazer com que os valores se encontrem dentro de um intervalo especificado.





3
O que significa “normalização” e como verificar se uma amostra ou uma distribuição está normalizada?
Eu tenho uma pergunta na qual ele pede para verificar se a distribuição Uniform ( ) está normalizada.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Por um lado, o que significa que qualquer distribuição seja normalizada? E segundo, como vamos verificar se uma distribuição é normalizada ou não? Entendo que ao calcular obtemos dados normalizados , …


4
Normalização antes da validação cruzada
Os dados de normalização (com média zero e desvio padrão da unidade) antes de executar uma validação cruzada repetida em dobra k tem conquistas negativas, como ajuste excessivo? Nota: isto é para uma situação em que #cases> total #features Estou transformando alguns dos meus dados usando uma transformação de log …

1
Como a normalização quantílica funciona?
Nos estudos de expressão gênica usando microarranjos, os dados de intensidade devem ser normalizados para que as intensidades possam ser comparadas entre indivíduos, entre genes. Conceitualmente e algoritmicamente, como funciona a "normalização quantílica" e como você explicaria isso a um não estatístico?





5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
Uma medida robusta (não paramétrica) como Coeficiente de variação - IQR / mediana ou alternativa?
Para um dado conjunto de dados, o spread é frequentemente calculado como o desvio padrão ou como o IQR (intervalo inter-quartil). Enquanto a standard deviationé normalizado (escores z, etc.) e, portanto, pode ser usado para comparar a dispersão de duas populações diferentes, esse não é o caso do IQR, pois …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.