Eu pesquisei sobre k-means e é isso que obtive: k-means é um dos algoritmos mais simples que usa o método de aprendizado não supervisionado para resolver problemas conhecidos de agrupamento. Funciona muito bem com grandes conjuntos de dados.
No entanto, também existem desvantagens do K-Means, que são:
- Forte sensibilidade a outliers e ruído
- Não funciona bem com a forma não circular do cluster - o número de cluster e o valor inicial da semente precisam ser especificados com antecedência
- Baixa capacidade de superar o ideal local.
Existe algo ótimo sobre o k-means, porque parece que as desvantagens estão além das coisas boas do k-means.
Por favor ensina-me.