Perguntas com a marcação «dimensionality-reduction»

Refere-se a técnicas para reduzir um grande número de variáveis ​​ou dimensões abrangidas pelos dados para um número menor de dimensões, preservando o máximo de informações possível sobre os dados. Métodos de destaque incluem PCA, MDS, Isomap, etc. As duas principais subclasses de técnicas: extração e seleção de recursos.


1
Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais?
A regressão de classificação reduzida e a regressão de componentes principais são apenas casos especiais de mínimos quadrados parciais? Este tutorial (Página 6, "Comparação de objetivos") afirma que, quando fazemos mínimos quadrados parciais sem projetar X ou Y (ou seja, "não parcial"), ele se torna uma regressão de classificação reduzida …


4
Quais variáveis ​​explicam quais componentes do PCA e vice-versa?
Usando estes dados: head(USArrests) nrow(USArrests) Eu posso fazer um PCA da seguinte maneira: plot(USArrests) otherPCA <- princomp(USArrests) Eu posso obter os novos componentes em otherPCA$scores ea proporção de variância explicada pelos componentes com summary(otherPCA) Mas e se eu quiser saber quais variáveis ​​são explicadas principalmente por quais componentes principais? E …





1
Álgebra de LDA. Poder de discriminação de Fisher de uma variável e Análise Discriminante Linear
Pelo visto, a análise de Fisher visa maximizar simultaneamente a separação entre classes, enquanto minimiza a dispersão dentro da classe. Uma medida útil do poder de discriminação de uma variável é, por conseguinte, dada pela quantidade diagonal: Bii/WiiBii/WiiB_{ii}/W_{ii} . http://root.cern.ch/root/htmldoc/TMVA__MethodFisher.html Eu entendo que o tamanho ( p x p) das …



1
Qual é o significado dos eixos no t-SNE?
Atualmente, estou tentando entender a matemática do t-SNE . Infelizmente, ainda há uma pergunta que não consigo responder satisfatoriamente: qual é o significado real dos eixos em um gráfico t-SNE? Se eu fosse fazer uma apresentação sobre esse tópico ou incluí-lo em qualquer publicação: Como rotularia os eixos de maneira …

5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.