Eu tenho uma pergunta muito básica sobre clustering. Depois de encontrar k clusters com seus centróides, como faço para interpretar as classes dos pontos de dados que agrupei (designando rótulos de classe significativos para cada cluster). Não estou falando da validação dos clusters encontrados.
Pode ser feito com base em um pequeno conjunto de pontos de dados rotulados, para calcular a qual cluster esses pontos rotulados pertencem e com base no tipo e número de pontos que cada cluster recebe, decidir o rótulo? Isso parece bastante óbvio, mas não sei como é padrão atribuir rótulos a clusters dessa maneira.
Para ser claro, desejo executar um cluster não supervisionado que não use nenhum rótulo para encontrar primeiro meus clusters. Depois de encontrar os clusters, desejo atribuir rótulos de classe significativos aos clusters com base nas propriedades de alguns exemplos de pontos de dados.