Eu nunca tive uma falha que eu poderia atribuir aos bigodes de zinco / estanho, embora meu conjunto de amostras não seja enorme e eu realmente nunca tenha tido uma série de falhas na fonte de alimentação, como você descreve, que me levariam a uma busca por uma causa raiz.
Eu estaria olhando para problemas mais convencionais (capacitores ruins na fonte de alimentação ou uma taxa de falha elétrica transitória bastante alta, especialmente porque você diz que teve duas "grandes ocorrências" de falhas na fonte de alimentação), embora pareça que você já tem.
Minha lista curta, caso seja diferente da sua / do seu eletricista:
Eletricamente: energia mal estabilizada devido a um no-break ou PDU / CDU instável, falhas de aterramento, etc. Se suas "grandes ocorrências" ocorreram em áreas servidas pelo mesmo equipamento de distribuição de energia, isso se tornará mais provável.
Ambientalmente: temperatura e umidade; Verifique a temperatura de entrada / saída do seu equipamento (especialmente se as falhas ocorrerem na mesma área física do datacenter: Você pode descobrir um problema de fluxo de ar / resfriamento, causando o aquecimento do seu equipamento).
CQ do equipamento / fabricante: verifique as fontes de alimentação esgotadas quanto a capacitores abaulados / soprados, especialmente se as falhas ocorrerem em unidades compradas na mesma época. Certifique-se de não pressionar demais as fontes de alimentação (muitos discos rígidos e CPUs com muita energia podem exigir uma fonte de alimentação maior)