O número mínimo é 1 servidor. Se por "produção" você quer dizer "tolerante a falhas", o número mínimo é 3: você tem um conjunto de réplicas contendo 3 servidores. Os servidores de configuração também são executados nesses servidores. Se você deseja incluir "escala horizontal", ou seja, "escala da web!" além disso, o número mínimo é 9: você tem 2 shards consistindo em conjuntos de réplicas de 3 servidores e mais 3 servidores como servidores de configuração. Se você incluir seu aplicativo, não apenas o mongodb, adicione seus dois servidores de aplicativos à mistura para um total de 11 (vai para 11!).
Basicamente, você está interpretando essa imagem incorretamente de duas maneiras: seus servidores de aplicativos não fazem parte de um cluster mongodb e os shards (caixas verdes) são conjuntos de réplicas, que contêm pelo menos três servidores.