Lutamos com o controlador RAID em nosso servidor de banco de dados, um Lenovo ThinkServer RD120. É um Adaptec renomeado que a Lenovo / IBM dubla o ServeRAID 8k .
Corrigimos este ServeRAID 8k até o mais recente e melhor:
- Versão do BIOS RAID
- Versão do BIOS do backplane RAID
- Driver do Windows Server 2008
Este controlador RAID teve várias atualizações críticas do BIOS, mesmo nos curtos 4 meses em que possuímos, e o histórico de alterações é simplesmente ... bem, assustador.
Tentamos estratégias de write-back e write-through nas unidades lógicas RAID. Ainda temos erros intermitentes de E / S sob atividades pesadas do disco. Eles não são comuns, mas sérios quando ocorrem, pois causam tempos limite de E / S do SQL Server 2008 e, às vezes, falha dos conjuntos de conexões SQL.
Estávamos no final de nossa corda solucionando esse problema. Com poucas coisas difíceis, como substituir todo o servidor ou substituir o hardware RAID, estávamos desesperados.
Quando obtive o servidor, tive um problema em que o compartimento de unidade nº 6 não era reconhecido. Mudar os discos rígidos para uma marca diferente, estranhamente, corrigiu isso - e atualizar o BIOS RAID (pela primeira vez) corrigiu permanentemente, para que eu pudesse usar a unidade "incompatível" original no compartimento 6. Em uma palpite, comecei a supor que os discos rígidos SATA da Western Digital que eu escolhi eram de alguma forma incompatíveis com o controlador ServeRAID 8k.
Comprar 6 novos discos rígidos foi uma das opções mais baratas da mesa, então eu optei por 6 discos rígidos Hitachi (também conhecidos como IBM), segundo a teoria de que um controlador RAID IBM / Lenovo tem mais probabilidade de funcionar com os discos normalmente vendido com.
Parece que esse palpite valeu a pena - passamos por três dos nossos dias mais pesados de carregamento (seg, ter, qua) sem um único erro de E / S de qualquer tipo. Antes disso, tínhamos regularmente pelo menos um "evento" de E / S nesse período. Parece que mudar de marca de disco rígido corrigiu nossos problemas intermitentes de E / S de RAID!
Embora eu compreenda que a IBM / Lenovo provavelmente testa seu controlador RAID exclusivamente com sua própria marca de discos rígidos, estou perturbado que um controlador RAID tenha problemas de E / S tão sutis com marcas específicas de discos rígidos.
Então, minha pergunta é: esse tipo de incompatibilidade de unidade SATA é comum nos controladores RAID? Existem algumas marcas de unidades que funcionam melhor que outras ou são "validadas" em relação a um controlador RAID específico? Eu achava que todos os discos rígidos SATA comuns eram iguais e funcionariam razoavelmente bem em qualquer controlador RAID (de qualidade suficiente).