Você já ouviu falar em aproximação e projeção de coletores uniformes (UMAP) ?
UMAP (Aproximação e projeção do coletor uniforme) é uma nova técnica de aprendizado de coletores para redução de dimensão não linear. O UMAP é construído a partir de uma estrutura teórica baseada na geometria de Riemann e na topologia algébrica. O resultado é um algoritmo escalável prático que se aplica a dados do mundo real. O algoritmo UMAP é competitivo com o t-SNE pela qualidade da visualização e, sem dúvida, preserva mais da estrutura global com desempenho superior em tempo de execução. Além disso, o UMAP, conforme descrito, não possui restrições computacionais na dimensão de incorporação, tornando-o viável como uma técnica de redução de dimensão de uso geral para aprendizado de máquina.
Verifique o código e o papel original para obter uma lista de prós e contras, é super fácil de usar.
Fatos rápidos: O UMAP pode lidar com grandes conjuntos de dados e é mais rápido que o t-SNE e também suporta o ajuste de dados de matriz esparsos, e ao contrário do t-SNE, uma técnica de redução de dimensão de uso geral, o que significa que não apenas ele pode ser usado para visualização, mas também para reduzir o espaço de recursos para alimentar outros modelos de aprendizado de máquina.
Exemplos concretos: comparei o método e o comparei com outras técnicas de redução de dimensionalidade do notebook de referência , se estiver interessado em dar uma olhada rápida e dar um salto inicial.