Vamos pegar o problema em pequena escala. Um pequeno escritório com um servidor executando correio, ActiveDirectory, compartilhamento de arquivos e o site da empresa.
Os hackers acertam e você precisa reiniciar porque o IIS está bagunçado. Ou o Exchange precisa de uma atualização e uma reinicialização. Ou o Active Directory foi corrompido.
Qualquer um desses problemas isolados de "um serviço está inativo" afeta o servidor inteiro; portanto, qualquer compartilhamento nesse servidor os afetará em virtude de ter que reiniciar ou qualquer outra coisa.
Depois que um verdadeiro cara de TI aparecer e ver esse servidor, ele recomendará dividi-los em servidores separados (e ter um servidor de controlador de domínio de backup).
É o velho ditado de "não coloque todos os seus ovos em uma cesta"
Agora que a filosofia é aplicada aos servidores web. Se eu tiver apenas um servidor Web e publicar meu aplicativo Web (o novo MyFaceLink.com) e ele se tornar realmente popular, tenho novos problemas. Não posso desativar o site para fazer manutenção enquanto os usuários estiverem nele. E se ele travar ou eu tiver muitos usuários, eu vou de mangueira. Até o maior servidor único do mundo ficará sobrecarregado com 1 bilhão de conversões de FB chegando.
Portanto, o balanceamento de carga entra em ação, pelo mesmo motivo "ovos na cesta". Espalhe o site por três servidores e, se um deles cair, os 2 restantes lidam com a capacidade. Se eu precisar fazer patches, eu apenas faço um de cada vez, e ninguém percebe.
No mais simples, não se trata do preço do mega-servidor ou se ele pode realmente lidar com a carga (embora possa ser). É sobre um único ponto de falha. Quando os negócios estão ocupados o suficiente e acontecem 24 horas por dia, 7 dias por semana, em vez de para 5 usuários trabalhando de 8 a 5, o tempo de inatividade não é aceitável. Interrupções programadas são mais difíceis de agendar. Então, você espalha a carga.