A principal diferença entre t-SNE e UMAP é a interpretação da distância entre objetos ou "aglomerados". Uso as aspas, pois os dois algoritmos não se destinam ao cluster - eles são principalmente para visualização.
O t-SNE preserva a estrutura local nos dados.
O UMAP afirma preservar a estrutura local e a maior parte da estrutura global nos dados.
Isso significa que com t-SNE você não pode interpretar a distância entre os clusters A e B nas diferentes extremidades do gráfico. Você não pode inferir que esses clusters são mais diferentes do que A e C, onde C está mais próximo de A na plotagem. Mas no cluster A, você pode dizer que pontos próximos um do outro são objetos mais semelhantes do que pontos em extremidades diferentes da imagem do cluster.
Com o UMAP, você deve conseguir interpretar as distâncias entre / posições de pontos e clusters.
Ambos os algoritmos são altamente estocásticos e dependem muito da escolha de hiperparâmetros (t-SNE ainda mais que UMAP) e podem produzir resultados muito diferentes em execuções diferentes, portanto, seu gráfico pode ofuscar uma informação nos dados que uma execução subseqüente possa revelar.
O bom PCA antigo, por outro lado, é determinístico e facilmente compreensível com o conhecimento básico de álgebra linear (multiplicação de matrizes e problemas próprios), mas é apenas uma redução linear em contraste com as reduções não lineares de t-SNE e UMAP.