Eu tenho um conjunto de dados de milhares de pontos e um meio de medir a distância entre dois pontos, mas os pontos de dados não têm dimensionalidade. Eu quero um algoritmo para encontrar centros de cluster neste conjunto de dados. Eu imagino que, como os dados não têm dimensões, um centro de cluster pode consistir em vários pontos de dados e uma tolerância, e a associação dentro do cluster pode ser determinada pela média da distância de um ponto de dados a cada ponto de dados no centro de cluster.
por favor me perdoe se esta pergunta tem uma solução bem conhecida, sei muito pouco sobre esse tipo de problema! minha pesquisa (muito limitada) só descobriu algoritmos de agrupamento para dados dimensionais, mas peço desculpas antecipadamente se perdi algo óbvio.
obrigado!