Nos é dado um conjunto de pontos bidimensionais e um número inteiro . Precisamos encontrar uma coleção de círculos que incluam todos os pontos, de modo que o raio do maior círculo seja o menor possível. Em outras palavras, devemos encontrar um conjunto de pontos centrais, de modo que a função de custo é minimizado. Aqui, denota a distância euclidiana entre um ponto de entrada p_i e um ponto central c_j . Cada ponto se atribui ao centro de cluster mais próximo, agrupando os vértices em kk k n C = { c 1 , c 2 , … , c k } k custo ( C ) = max i min j D ( p i , c j ) D p i c j k aglomerados diferentes.
O problema é conhecido como o problema (discreto) de cluster e é -hard. Pode ser mostrado com uma redução do problema do conjunto dominante que, se existir um algoritmo de aproximação para o problema com então .
O algoritmo ideal aproximação 2 é muito simples e intuitivo. Primeiro, escolhe-se um ponto arbitrariamente e o coloca no conjunto dos centros de cluster. Em seguida, escolhe-se o próximo centro de cluster, o mais distante possível de todos os outros centros de cluster. Então enquanto , que repetidamente encontrar um ponto de para os quais a distância seja maximizada e adicioná-lo a . Uma vez terminamos.
Não é difícil ver que o algoritmo guloso ideal é executado no tempo . Isso levanta uma questão: podemos alcançar ? Quanto melhor podemos fazer?