Não sou especialista em SANs, estou escrevendo aqui para obter algumas dicas sobre problemas contínuos e exasperantes que estamos enfrentando e que nosso fornecedor parece não ser capaz de resolver.
possuímos uma SAN ENHANCE ES3160P4 com discos de 16 x 2 TB que foi fornecida para o nosso sistema de vigilância por vídeo. A SAN foi configurada pelo fornecedor para usar 14 discos em uma matriz RAID 5 e 2 discos são peças de reposição globais. O RAID geralmente é dividido em 2 discos virtuais de tamanho igual que abrangem todo o espaço RAID. Cada um resulta em algo mais que 12 TB. Cada disco virtual corresponde a um único LUN, conectado a um único servidor de vídeo que armazena dados de vídeo continuamente e permite que os usuários recuperem gravações quando necessário. Os LUNs são formatados com NTFS e anexados aos servidores de vídeo do Windows Server 2012 por meio do iSCSI. Os servidores de vídeo tendem a usar totalmente o espaço disponível.
Com essa configuração, os discos da SAN estão falhando e falham, e cada vez que a SAN não pode recuperar o RAID, porque outro disco falha nesse meio tempo. Perdemos o RAID quatro vezes nos últimos meses.
Esse problema parece não ter sido causado por uma amostra ruim da SAN, porque possuímos outras três máquinas do mesmo tipo configuradas de maneira semelhante que parecem ter os mesmos problemas. Apenas um não tem problemas, mas no momento está subutilizado.
Após alguns meses de testes e verificações desconhecidos, o fornecedor acabou dizendo que é sabido que a SAN não deve ser usada 100% ou que se degradará rapidamente, também fisicamente, e disse que, para resolver o problema, os discos virtuais devem ser criados deixando 10 a 15% do espaço total disponível no RAID.
Pesquisei na web pelo problema e não encontrei declarações específicas dizendo isso. Parece-me que seria mais razoável criar discos virtuais abrangendo todo o RAID e subutilizar os LUNs (ou seja, permitindo que o Windows tivesse espaço livre e evitasse a fragmentação). Caso contrário, não entendo por que a ENHANCE SAN permite criar discos virtuais que abrangem todo o RAID, se é tão "conhecido" que resta algum espaço livre e por que o fornecedor configurou o sistema dessa maneira no início ... mas esse é outro ponto.
No final, queremos resolver esta situação. Qualquer sugestão é aceita. Como já foi dito, não sou especialista em SAN, mas depois de tantos problemas, gostaria de realmente entender se o fornecedor sabe o que está acontecendo ou não, porque não podemos mais aceitar essa situação.
Muito obrigado antecipadamente! Saudações
Editar: tipo de disco Como resposta, parece ser uma informação relevante. Acrescento que os discos são todos do modelo Western Digital WD2001FYYG-01SL3.
With this configuration the disks of the SAN are failing and failing, and each time the SAN cannot recover the RAID because another disk fails in the meanwhile. We lost the RAID like 4 times in the last few months.
Isso é exatamente porque, como a TomTom diz, os discos são grandes demais para o RAID5. E provavelmente RAID 6 também, FWIW. Suas chances de uma reconstrução bem-sucedida não chegam nem perto de 100%, e você sabe disso porque declarou que teve "como 4" reconstruções malsucedidas em questão de meses. Sua configuração de RAID é idiota e seu fornecedor é incompetente, simples assim.