Para uma tarefa, fui solicitado a fornecer uma prova de que k-means converge em um número finito de etapas.
Isto é o que eu escrevi:
A seguir, é uma coleção de todos os centros de cluster. Definir uma “energia” função
A função de energia é não-negativo. Vemos que as etapas (2) e (3) do algoritmo reduzem a energia. Como a energia é limitada por baixo e constantemente reduzida, ela deve convergir para um mínimo local. A iteração pode ser interrompida quando muda a uma taxa abaixo de um determinado limite.
A etapa 2 refere-se à etapa que rotula cada ponto de dados pelo centro de cluster mais próximo e a etapa 3 é a etapa em que os centros são atualizados com uma média.
Isso não é suficiente para provar a convergência em um número finito de etapas. A energia pode continuar diminuindo, mas não descarta a possibilidade de que os pontos centrais possam pular sem alterar muito a energia. Em outras palavras, pode haver múltiplos mínimos de energia e o algoritmo pode pular entre eles, não?