Não entendo por que a redução na dimensão é importante. Qual é o benefício de obter alguns dados e reduzir sua dimensão?
Não entendo por que a redução na dimensão é importante. Qual é o benefício de obter alguns dados e reduzir sua dimensão?
Respostas:
A decomposição de valor singular (SVD) não é o mesmo que reduzir a dimensionalidade dos dados. É um método de decompor uma matriz em outras matrizes que possui muitas propriedades maravilhosas nas quais não vou entrar aqui. Para mais informações sobre SVD, consulte a página da Wikipedia .
Reduzir a dimensionalidade dos seus dados às vezes é muito útil. Pode ser que você tenha muito mais variáveis que observações; isso não é incomum no trabalho genômico. Pode ser que tenhamos várias variáveis altamente correlacionadas, por exemplo, quando elas são fortemente influenciadas por um pequeno número de fatores subjacentes e desejamos recuperar alguma aproximação aos fatores subjacentes. Técnicas de redução de dimensionalidade, como análise de componentes principais, dimensionamento multidimensional e análise de variáveis canônicas, nos dão uma ideia das relações entre observações e / ou variáveis que talvez não consigamos de outra maneira.
Um exemplo concreto: há alguns anos, eu estava analisando uma pesquisa de satisfação de funcionários com mais de 100 perguntas. Bem, nenhum gerente será capaz de analisar mais de 100 perguntas no valor de respostas, mesmo resumidas, e fazer mais do que adivinhar o que tudo isso significa, porque quem pode dizer como as respostas estão relacionadas e o que as está dirigindo, realmente ? Realizei uma análise fatorial dos dados, para as quais tive mais de 10.000 observações, e vi cinco fatores muito claros e prontamente interpretáveis que poderiam ser usados para desenvolver pontuações específicas do gerente (uma para cada fator) que resumissem a totalidade das a pesquisa com mais de 100 perguntas. Uma solução muito melhor do que o despejo de planilha do Excel que tinha sido o método anterior de relatar resultados!
Em relação ao segundo ponto da pergunta, os benefícios da redução de dimensionalidade para um conjunto de dados podem ser:
Fora isso, além do PCA, os SVDs têm muitas aplicações em Processamento de Sinais, PNL e muito mais
Dê uma olhada nesta resposta minha. A decomposição de valor singular é um componente-chave da análise de componentes principais , que é uma técnica de análise de dados muito útil e muito poderosa.
É frequentemente usado em algoritmos de reconhecimento facial, e eu o uso frequentemente em meu trabalho diário como analista de fundos de hedge.