Perguntas com a marcação «dimensionality-reduction»

Refere-se a técnicas para reduzir um grande número de variáveis ​​ou dimensões abrangidas pelos dados para um número menor de dimensões, preservando o máximo de informações possível sobre os dados. Métodos de destaque incluem PCA, MDS, Isomap, etc. As duas principais subclasses de técnicas: extração e seleção de recursos.

5
Como os principais componentes principais podem reter o poder preditivo de uma variável dependente (ou até levar a melhores previsões)?
Suponha que eu estou correndo uma regressão . Por seleccionando top principais componentes do , é que o modelo de manter o seu poder preditivo em ?k X YY∼XY∼XY \sim XkkkXXXYYY Eu entendo que a partir de-redução de dimensionalidade / ponto de recurso de seleção de vista, se são os …

2
Como entender “não linear” como em “redução de dimensionalidade não linear”?
Estou tentando entender as diferenças entre os métodos de redução de dimensionalidade linear (por exemplo, PCA) e os não lineares (por exemplo, Isomap). Não consigo entender direito o que a (não) linearidade implica nesse contexto. Eu li na Wikipedia que Por comparação, se o PCA (um algoritmo de redução de …

3
A redução de dimensionalidade para visualização deve ser considerada um problema "fechado", resolvido pelo t-SNE?
Eu tenho lido muito sobre o algoritmo sne para redução de dimensionalidade. Estou muito impressionado com o desempenho em conjuntos de dados "clássicos", como o MNIST, onde ele consegue uma separação clara dos dígitos ( consulte o artigo original ):ttt Também o usei para visualizar os recursos aprendidos por uma …


2
O que é "regressão de classificação reduzida"?
Li os Elementos do aprendizado estatístico e não conseguia entender o que é a Seção 3.7 "Seleção e contração de múltiplos resultados". Ele fala sobre RRR (regressão de classificação reduzida), e só consigo entender que a premissa é sobre um modelo linear multivariado generalizado em que os coeficientes são desconhecidos …

1
t-SNE versus MDS
Ultimamente, tenho lido algumas perguntas sobre t-SNE ( Incorporação estocástica de vizinhos t-distribuídos ) e também visitou algumas perguntas sobre MDS ( Multidimensional Scaling ). Eles costumam ser usados ​​de forma análoga; portanto, parecia uma boa idéia fazer essa pergunta, pois há muitas perguntas sobre as duas separadamente (ou comparadas …


4
Por que os dados mistos são um problema para os algoritmos de cluster baseado em euclidianos?
A maioria dos algoritmos clássicos de agrupamento e redução de dimensionalidade (agrupamento hierárquico, análise de componentes principais, médias médias, mapas auto-organizados ...) são projetados especificamente para dados numéricos, e seus dados de entrada são vistos como pontos em um espaço euclidiano. É claro que isso é um problema, pois muitas …


1
Como o LDA, uma técnica de classificação, também serve como técnica de redução de dimensionalidade como o PCA
Neste artigo , o autor vincula a análise discriminante linear (LDA) à análise de componentes principais (PCA). Com meu conhecimento limitado, não sou capaz de acompanhar como o LDA pode ser um pouco semelhante ao PCA. Eu sempre pensei que o LDA era uma forma de algoritmo de classificação, semelhante …






Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.