Eu sei que algumas grandes empresas, como IBM, Amazon e governos, exigem um alto grau de disponibilidade e retenção de dados com seus servidores. Para conseguir isso, eles usam redundância. Minha pergunta é: quais componentes de um servidor (e cluster) geralmente são redundantes? Eu tinha trabalhado brevemente em tal sala de servidores e notei redundância em coisas como
- suprimentos de energia
- RAID foi usado com um mínimo de 10 discos e geralmente tinha hot spare
- placas de rede
- os cartões de rede em si tinham várias portas Ethernet
- Backup UPS
- gerador de diesel
O que mais é comum em redundância? Eu sei que um servidor inteiro pode ser espelhado. Qualquer componente de computador pode ser redundante, por exemplo, computadores possuem várias CPUs atualmente, mas eu acho que você não consideraria isso redundante, já que todos estão sendo usados de uma só vez, então a chance de falha é equivalente a todos eles, eu entendo está certo? A memória pode ser redundante?
Eu estaria interessado em ver estatísticas para qual parte de um servidor falha com mais freqüência.