Eu tenho um grande conjunto de dados e uma semelhança de cosseno entre eles. Eu gostaria de agrupá-los usando a semelhança de cosseno que reúne objetos semelhantes sem precisar especificar antecipadamente o número de clusters que eu espero.
Eu li a documentação do sklearn do DBSCAN e da Affinity Propagation, onde ambos exigem uma matriz de distância (não uma matriz de semelhança de cossenos).
Realmente, estou apenas procurando por um algoritmo que não exija a) uma métrica de distância eb) um número pré-especificado de clusters .
Alguém sabe de um algoritmo que faria isso?