A resposta de Sergey contém o ponto crítico, que é o de que o coeficiente da silhueta quantifica a qualidade do agrupamento alcançado - portanto, você deve selecionar o número de clusters que maximiza o coeficiente da silhueta.
A resposta longa é que a melhor maneira de avaliar os resultados de seus esforços de cluster é começar realmente examinando - inspeção humana - os clusters formados e fazendo uma determinação com base no entendimento do que os dados representam, do que um cluster representa, e o que o clustering pretende alcançar.
Existem numerosos métodos quantitativos de avaliação dos resultados do agrupamento que devem ser usados como ferramentas, com total compreensão das limitações. Eles tendem a ser bastante intuitivos por natureza e, portanto, têm um apelo natural (como problemas de agrupamento em geral).
Exemplos: massa / raio / densidade do cluster, coesão ou separação entre os clusters, etc. Esses conceitos geralmente são combinados, por exemplo, a taxa de separação para a coesão deve ser grande se o cluster for bem-sucedido.
A maneira como o clustering é medido é informada pelo tipo de algoritmo de clustering usado. Por exemplo, medir a qualidade de um algoritmo de clustering completo (no qual todos os pontos são colocados em clusters) pode ser muito diferente de medir a qualidade de um algoritmo de clustering fuzzy baseado em limites (no qual algum ponto pode ser deixado sem cluster como 'ruído' )
O coeficiente de silhueta é uma dessas medidas. Funciona da seguinte maneira:
Para cada ponto p, encontre primeiro a distância média entre pe todos os outros pontos no mesmo cluster (essa é uma medida de coesão, chame-a de A). Em seguida, encontre a distância média entre pe todos os pontos no cluster mais próximo (essa é uma medida de separação do outro cluster mais próximo, chame-o de B). O coeficiente de silhueta para p é definido como a diferença entre B e A dividida pela maior das duas (max (A, B)).
Avaliamos o coeficiente de cluster de cada ponto e, a partir disso, podemos obter o coeficiente médio 'geral' de cluster.
Intuitivamente, estamos tentando medir o espaço entre os clusters. Se a coesão do cluster for boa (A é pequena) e a separação do cluster for boa (B for grande), o numerador será grande etc.
Eu construí um exemplo aqui para demonstrar isso graficamente.
Nesses gráficos, os mesmos dados são plotados cinco vezes; as cores indicam os clusters criados pelo agrupamento k-means, com k = 1,2,3,4,5. Ou seja, forcei um algoritmo de clustering a dividir os dados em 2 clusters, depois 3 e assim por diante, e colori o gráfico de acordo.
O gráfico da silhueta mostra que o coeficiente da silhueta foi mais alto quando k = 3, sugerindo que esse é o número ideal de clusters. Neste exemplo, temos a sorte de poder visualizar os dados e podemos concordar que, de fato, três clusters capturam melhor a segmentação desse conjunto de dados.
Se não formos capazes de visualizar os dados, talvez por causa da dimensionalidade mais alta, um gráfico de silhueta ainda nos daria uma sugestão. No entanto, espero que minha resposta um tanto extenuada aqui também mostre que essa "sugestão" pode ser muito insuficiente ou simplesmente errada em certos cenários.