Não há realmente uma resposta. É algo entre 1 e N.
No entanto, você pode pensar sobre isso da perspectiva do lucro.
Por exemplo, no marketing, usa-se segmentação, que é muito parecida com cluster.
Uma mensagem (um anúncio ou carta, digamos), personalizada para cada indivíduo, terá a maior taxa de resposta. Uma mensagem genérica adaptada à média terá a menor taxa de resposta. Dito isto, três mensagens personalizadas para três segmentos estarão em algum lugar no meio. Este é o lado da receita.
Uma mensagem personalizada para cada indivíduo terá o custo mais alto. Uma mensagem genérica adaptada à média terá o menor custo. Três mensagens personalizadas para três segmentos estarão em algum lugar no meio.
Digamos que pagar a um escritor para escrever uma mensagem personalizada custa 1.000, dois custam 2000 e assim por diante.
Digamos, usando uma mensagem, sua receita será de 5000. Se você segmentou seus clientes em 2 segmentos e escreveu mensagens personalizadas para cada segmento, sua taxa de resposta será maior. Digamos que as receitas agora sejam 7500. Com três segmentos, uma taxa de resposta um pouco mais alta e suas receitas são 9000. Mais um segmento e você está com 9500.
Para maximizar o lucro, continue segmentando até que a receita marginal da segmentação seja igual ao custo marginal da segmentação. Neste exemplo, você usaria três segmentos para maximizar o lucro.
Segments Revenue Cost Profit
1 5000 1000 4000
2 7500 2000 5500
3 9000 3000 6000
4 9500 4000 5500
hopack
(e outros) que podem estimar o número de clusters, mas isso não responde à sua pergunta.