Usando mapas auto-organizados para redução de dimensionalidade

8

Nos últimos dias, venho realizando uma pesquisa sobre mapas auto-organizados para um projeto na escola. Eu entendi que mapas auto-organizados podem ser usados para reduzir a dimensionalidade de seus dados. No entanto, eu não entendo como isso funciona. Por exemplo, digamos que você tenha uma rede 10x10 de neurônios em um SOM e sua entrada seja 25-dimensional. Então, pelo meu entendimento, você criaria um vetor de característica para cada neurônio que também é 25D. Quando o treinamento é concluído, você acaba com 100 vetores 25D. Como isso reduz exatamente as dimensões dos dados? Devo me preocupar com a localização dos neurônios?

EDIT: Eu já li a pergunta Redução de dimensionalidade usando o mapa auto-organizado, mas não acho que ela responda à pergunta que tenho.

data-transformation dimensionality-reduction self-organizing-maps

— user1231745
fonte

12

O mapa auto-organizado (SOM) é uma grade de preenchimento de espaço que fornece uma redução de dimensionalidade discreta dos dados.

Você começa com um espaço de alta dimensão de pontos de dados e uma grade arbitrária que fica nesse espaço. A grade pode ter qualquer dimensão, mas geralmente é menor que a dimensão do seu conjunto de dados e geralmente é 2D, porque é fácil de visualizar.

Para cada dado no seu conjunto de dados, você encontra o ponto de grade mais próximo e "puxa" esse ponto de grade em direção ao conjunto de dados. Você também puxa cada um dos pontos de grade vizinhos em direção à nova posição do primeiro ponto de grade. No início do processo, você puxa muitos vizinhos em direção ao ponto de dados. Posteriormente no processo, quando sua grade estiver começando a preencher o espaço, você moverá menos vizinhos, e isso funcionará como uma espécie de ajuste fino. Esse processo resulta em um conjunto de pontos no espaço de dados que se encaixam razoavelmente bem na forma do espaço, mas também podem ser tratados como uma grade de menor dimensão.

Esse processo é bem explicado por duas imagens da página 1468 do artigo de Kohonen em 1990 :

Esta imagem mostra um mapa unidimensional em uma distribuição uniforme em um triângulo. A grade começa como uma bagunça no centro e é gradualmente puxada para uma curva que preenche o triângulo razoavelmente bem, dado o número de pontos da grade:

SOM unidimensional

A parte esquerda desta segunda imagem mostra uma grade 2D SOM preenchendo de perto o espaço definido pela forma do cacto à esquerda:

Cacto 2D SOM

Há um vídeo do processo do SOM usando uma grade 2D em um espaço 2D e em um espaço 3D no youtube.

Agora, cada um dos pontos de dados originais no espaço tem um vizinho mais próximo ao qual está atribuído. A grade é, portanto, o centro dos agrupamentos de pontos de dados. A grade fornece a redução de dimensionalidade.

Aqui está uma comparação da redução de dimensionalidade usando a análise de componentes principais (PCA), na página do SOM na wikipedia :

Redução da dimensionalidade do SOM em en.wikipedia.org/wiki/File:SOMsPCA.PNG

Percebe-se imediatamente que o SOM unidimensional fornece um ajuste muito melhor aos dados, explicando mais de 93% da variação, em comparação com 77% no PCA. No entanto, até onde sei, não há uma maneira fácil de explicar a variação restante, como existe no PCA (usando dimensões extras), pois não há uma maneira clara de desembrulhar os dados em torno da grade discreta do SOM.

— naught101
fonte

2

Apesar de você ter mais nós do que dimensões de recursos, ainda está reduzindo a dimensionalidade. Lembre-se de que, inicialmente, você tinha um espaço 25-dimensional e, agora, você tem essas 25 dimensões projetadas em apenas 2 dimensões. Em vez de representar todo o espaço 25-dimensional contínuo, o SOM fornece os pontos 'mais importantes' nesse espaço.

— felipeduque
fonte