As dimensões do espaço dimensional baixo não têm significado. Note-se que a função de perda de t-PND está exclusivamente com base nas distâncias entre pontos ( e y j ) e de probabilidade distribuições mais essas distâncias ( p i j e q i j ):yEuyjpeu jqeu j
δCδyEu= 4 ∑j( peu j- qeu j) ( yEu- yj) ( 1 + | | yEu- yj| |2)- 1
Portanto, não há projeção de todo o espaço de alta dimensão para o espaço de baixa dimensão, o t-SNE encontra apenas um mapeamento de um conjunto específico de pontos de alta dimensão para um conjunto específico de pontos de baixa dimensão. Como não há função de um espaço para o outro, também não há significado inerente dos eixos.
Coisas que você pode imaginar para ilustrar isso:
- Girar ou traduzir o espaço de alta ou baixa dimensão não influencia as distâncias entre os pontos. Portanto, t-SNE não se importa com rotação ou translação em ambos os espaços. Portanto, não há interpretação absoluta dos eixos.
- A distribuição t-Student tem caudas gordas. Isso faz com que a representação de baixa dimensão seja invariável a alterações em pontos distantes no espaço de alta dimensão. Isso também faz com que pontos distantes no espaço de alta dimensão possam estar razoavelmente distantes, distantes ou realmente distantes no espaço de baixa dimensão. Nesse sentido, estende certas partes dos eixos de baixa dimensão (em qualquer direção arbitrária).
Dito isto, o t-SNE é principalmente uma técnica de visualização e sua eficácia de redução de dimensão para outros fins não é óbvia (provavelmente não é adequada para cluster, extração de recursos ou seleção de recursos).
Também: o papel .