Há uma baixa probabilidade de falha completa do chassi ...
Você provavelmente encontrará problemas em suas instalações antes de sofrer uma falha completa de um gabinete blade.
Minha experiência é principalmente com os gabinetes blade HP C7000 e HP C3000 . Também gerenciei as soluções blade Dell e Supermicro. Fornecedor importa um pouco. Mas, em resumo, o equipamento da HP tem sido excelente, a Dell está bem e a Supermicro estava com falta de qualidade, resiliência e foi mal projetada. Nunca experimentei falhas do lado da HP e da Dell. O Supermicro teve sérias interrupções, forçando-nos a abandonar a plataforma. Na HP e na Dells, nunca encontrei uma falha completa no chassi.
- Eu tive eventos térmicos. O ar condicionado falhou em uma instalação de co-localização, enviando temperaturas para 115 ° F / 46 ° C por 10 horas.
- Picos de energia e falhas na linha: perdendo um lado de uma alimentação A / B. Falhas na fonte de alimentação individual. Normalmente, existem seis fontes de alimentação nas configurações do meu blade, portanto, há amplo aviso e redundância.
- Falhas de servidor blade individuais. Os problemas de um servidor não afetam os outros no gabinete.
- Um incêndio no chassi ...
Eu já vi vários ambientes e tive o benefício de instalar em condições ideais de data center, bem como em locais mais difíceis. No lado HP C7000 e C3000, o principal a considerar é que o chassi é totalmente modular. Os componentes são projetados para minimizar o impacto de uma falha de componente que afeta toda a unidade.
Pense dessa maneira ... O chassi principal do C7000 é composto por conjuntos de painel frontal e intermediário (passivo). O gabinete estrutural simplesmente mantém os componentes dianteiro e traseiro juntos e suporta o peso do sistema. Quase todas as partes podem ser substituídas ... acredite, desmontei muitas. Os principais despedimentos estão em gerenciamento / ventilador, refrigeração, energia e redes. Os processadores de gerenciamento ( Onboard Administrator da HP ) podem ser emparelhados para redundância, no entanto, os servidores podem ser executados sem eles.

Gabinete totalmente preenchido - vista frontal. As seis fontes de alimentação na parte inferior percorrem toda a profundidade do chassi e se conectam a um conjunto de backplane de energia modular na parte traseira do gabinete. Os modos de fonte de alimentação são configuráveis: por exemplo, 3 + 3 ou n + 1. Portanto, o gabinete definitivamente possui redundância de energia.

Gabinete totalmente preenchido - vista traseira. Os módulos de rede do Virtual Connect na parte traseira têm uma conexão cruzada interna, para que eu possa perder um lado ou outro e ainda manter a conectividade de rede com os servidores. Existem seis fontes de alimentação hot swap e dez ventiladores hot swap.

Gabinete vazio - vista frontal. Observe que não há realmente nada nessa parte do gabinete. Todas as conexões são passadas para o midplane modular.

Conjunto do painel intermediário removido. Observe as seis alimentações de energia para o conjunto do plano intermediário na parte inferior.

Montagem do painel intermediário. É aqui que a mágica acontece. Observe as 16 conexões separadas do downplane: uma para cada servidor blade. Eu tive que soquetes / compartimentos de servidor individuais falharem sem matar o gabinete inteiro ou afetar os outros servidores.

Painel traseiro da fonte de alimentação. 3 ° abaixo do módulo monofásico padrão. Troquei a distribuição de energia no meu data center e simplesmente troquei o backplane da fonte de alimentação para lidar com o novo método de fornecimento de energia

Danos no conector do chassi. Esse gabinete em particular foi derrubado durante a montagem, quebrando os pinos de um conector de fita. Isso passou despercebido por dias, resultando no chassi do blade de corrida pegando FIRE ...

Aqui estão os restos carbonizados do cabo plano do plano. Isso controlava parte da temperatura do chassi e do monitoramento do ambiente. Os servidores blade dentro continuaram a funcionar sem incidentes. As peças afetadas foram substituídas à vontade durante o tempo de inatividade programado e tudo estava bem.
