Por que o armazenamento corporativo é tão caro?


107

Esta é uma pergunta canônica sobre o custo do armazenamento corporativo.
Veja também a seguinte pergunta:

Em relação a questões gerais, como:

  • Por que tenho que pagar 50 dólares por mês por gigabyte extra de armazenamento?
  • Nosso servidor de arquivos está sempre ficando sem espaço. Por que nosso administrador de sistemas não lança apenas uma unidade extra de 1 TB?
  • Por que o equipamento SAN é tão caro?

As respostas aqui tentarão entender melhor como funciona o armazenamento em nível corporativo e o que influencia o preço. Se você pode expandir a pergunta ou fornecer informações sobre a resposta, poste.


17
Feche todas as perguntas "Por que o armazenamento é tão caro" e aponte-as aqui.
Mark Henderson

17
Isso não pretende ser um fórum de anúncios para todos que encontraram fornecedores baratos; trata-se de descrever os custos "ocultos" no armazenamento em nível empresarial.
Mark Henderson

2
Referência obrigatória do BOFH ("Preciso de mais espaço!"): Bofh.ntk.net/BOFH/0000/bastard01.php
Massimo

Jim Salter publicou um detalhamento disso, oferecendo a publicação no blog Depressing Storage Calculator . Conclusão: é necessário provisionar entre 10 e 25 vezes a quantidade de armazenamento visível do usuário final desejada, dependendo das suposições e requisitos.
um CVn

Respostas:


116
  1. As capacidades do disco rígido do servidor são minúsculas em comparação com as capacidades do disco rígido da área de trabalho. 450 e 600 GB não são tamanhos incomuns nos servidores novos, e você pode comprar muitas unidades de desktop SATA de 4 TB pelo preço de um disco rígido SAS (servidor) de 600 GB.

  2. O seu disco rígido SATA no seu PC de mesa em casa é como um muscle car da Ford, GM ou Mercedes ou qualquer outro fabricante de carros para pessoas comuns (V8 ou V12 de grande capacidade, 5 ou 6 litros). Como eles precisam ser conduzidos por pessoas que não possuem uma licença de corrida ou entendem como um motor de combustão interna funciona, eles têm tolerâncias muito grandes. Eles têm limitadores de rotação, são projetados para funcionar com qualquer óleo de uma determinada classificação, têm intervalos de manutenção a 10.000 km de distância, mas se você perder um intervalo de serviço por algumas semanas, ele não explodirá em seu rosto. Eles não pegam fogo quando você dirige longas distâncias.

    A unidade SAS em um servidor é mais semelhante a um mecanismo de Fórmula 1. Eles são realmente pequenos (2,4 litros), mas têm imensas saídas de energia por causa de suas pequenas tolerâncias. Eles aumentam as rotações e geralmente não têm limitador de rotações (o que significa que sofrem danos sérios se acionados incorretamente) e, se você perder um intervalo de serviço (a cada poucas horas ), eles explodem.

    Você está basicamente comparando giz e queijo. Os números e uma análise completa são discutidos nos discos rígidos da Intel Whitepaper Enterprise-class versus Desktop-class

  3. Vamos falar de alguns números concretos aqui. Digamos que você solicite 1 MB de dados adicionais (um bom número redondo). Quantos dados são realmente ? Bem, seus 1 MB de dados vão para uma matriz RAID. Digamos que eles estejam seguros e transformando isso em RAID1. Seus 1 MB de dados são espelhados, então, na verdade, são 2 MB de dados.

    Digamos que seus dados estejam dentro de uma SAN. No caso de uma falha no nó da SAN, seus dados são sincronizados no nível de bytes com um segundo nó da SAN. Portanto, ele é duplicado e seus 2 MB de dados agora são de 4 MB.

    Você espera que seu provedor mantenha backups no local, para que seus dados possam ser restaurados em caso de emergência que não seja um desastre? Qualquer provedor decente fornecerá pelo menos um backup no local, talvez mais. Digamos que eles tirem instantâneos uma vez por semana durante três semanas no local. Como são 3 MB de dados extras, agora você tem até 7 MB.

    Se houver um desastre crítico, é melhor que seu provedor tenha uma cópia mantida fora do local em algum lugar. Mesmo se tiver um mês, deve existir. Então agora você tem até 8 MB.

    Se é realmente um provedor de alto nível, eles podem até ter um site de recuperação de desastre sincronizado ao vivo. Esses discos também sofrerão RAID, o que significa 2 MB extras e, portanto, você terá até 10 MB de dados.

    Você precisará transferir esses dados eventualmente. O que? Transferir? Sim, a transferência de dados custa dinheiro. Custa dinheiro quando você faz o download, acessa-o pela Internet, custa até fazer o backup (alguém precisa tirar essas fitas do escritório e pode ser que seus 1 MB de dados signifiquem que eles precisam comprar um extra) conjunto de fitas e transfira-as para algum lugar).

  4. Quando sua unidade doméstica SATA falha, você pode ligar para o suporte técnico e convencê-los de que sua unidade está morta. Em seguida, envie sua unidade para o fabricante (por conta própria na maioria das vezes). Espere uma semana. Recupere uma unidade de reposição e precise reinstalá-la (quase certamente não é hot swap ou já está em um trenó).

    Quando a unidade SAS falha, você liga para o suporte técnico. Eles quase nunca questionam sua opinião de que a unidade precisa de substituição imediata e envia uma nova unidade; geralmente a nova unidade é entregue mais tarde no mesmo dia, caso contrário, o dia seguinte também é muito comum. Geralmente, o fabricante envia um representante para realmente instalar a unidade, se você não souber como (muito útil se você planeja tirar férias e precisar que as coisas continuem funcionando enquanto você estiver ausente).

  5. As unidades empresariais têm tolerâncias rígidas, consulte o item 2 acima e tendem a durar cerca de 10 vezes mais que as unidades de grau de consumo (MTBF). As unidades corporativas quase sempre oferecem suporte à detecção avançada de erros e falhas, que, segundo um relatório do Google, funciona cerca de 40% das vezes, mas isso é algo que qualquer um prefere a um computador que morre repentinamente.

    Quando você tem uma única unidade no seu computador doméstico, suas chances estatísticas de falha são simplesmente as da unidade. As unidades costumavam ser classificadas no MTBF (onde as unidades SAS ainda possuem classificações ~ 50% mais altas ou mais), agora é mais comum ver taxas de erro. Uma unidade SAS típica tem 10 a 1.000 vezes menos chances de ter um erro irrecuperável (com 100x o mais comum que encontrei recentemente). (taxas de erro de acordo com a documentação do fabricante fornecida pela Seagate, Western Digital e Hitachi; sem viés pretendido; negam expressamente a indenização).

    As taxas de erro são particularmente importantes não quando você encontra um erro irrecuperável em uma unidade, mas quando outra unidade na mesma matriz falha e você não depende de todas as unidades de uma matriz para serem legíveis para recuperar o disco com falha.

  6. O SAS é um derivado do SCSI, que é um protocolo de armazenamento. O SATA é baseado no ATA, que é baseado no barramento ISA (aquele barramento de 8/16 bits em computadores da era dos dinossauros). O protocolo de armazenamento SCSI possui comandos mais abrangentes para otimizar a maneira como os dados são transferidos das unidades para os controladores e vice-versa. Esse aumento na eficiência tornaria uma unidade SAS de outra forma igual por natureza mais rápida, especialmente sob cargas de trabalho extremas, do que uma unidade SATA; também aumenta o custo.

  7. Há menos unidades SAS produzidas, as economias de escala determinam que elas serão mais caras, sendo o resto igual.

  8. As unidades SAS geralmente vêm em velocidades de rotação de 10k ou 15k; enquanto o SATA geralmente vem em 5.4k ou 7.2k. As unidades SAS, particularmente o tamanho de 2,5 "que estão se tornando cada vez mais populares, têm tempos de busca mais rápidos. Os dois combinados aumentam drasticamente os IOps que uma unidade pode executar, normalmente uma unidade SAS é ~ 3x mais rápida. Quando vários usuários exigem dados diferentes, os IOps A capacidade do inversor / matriz se torna um indicador crítico de desempenho.

  9. As unidades em um data center normalmente são ativadas o tempo todo. Estudos descobriram que a falha do inversor é influenciada pelo número de ciclos de aquecimento / resfriamento pelos quais ele passa (de funcionamento versus desligado). Mantê-los funcionando o tempo todo normalmente aumenta a vida útil da unidade. A conseqüência disso é que as unidades consomem eletricidade. Essa eletricidade deve ser fornecida por alguma coisa (no caso de um grande DC, os inversores podem consumir mais energia do que um pequeno bairro de casas). Eles também precisam dissipar esse calor em algum lugar, exigindo sistemas de refrigeração (que, por si só, exigem mais energia para operar).

  10. Custos de infraestrutura e pessoal. Essas unidades estão em unidades NAS ou SAN de ponta. Essas unidades são caras, mesmo sem as unidades caras. Eles exigem funcionários caros para implantá-los e mantê-los. Os prédios em que essas unidades NAS e SAN são caras são de operação (veja o tópico sobre refrigeração, acima, mas há muito mais acontecendo lá.) O software de backup normalmente não é gratuito (nem as licenças para coisas como espelhamento) , e a equipe para implantar e manter backups também costuma ser cara. O custo de alugar entrega e armazenamento de fita fora do local é apenas mais uma das muitas coisas que começam a se acumular quando você precisa de mais armazenamento.

Tendo em mente que a capacidade de suas unidades pode ser 1/10 do tamanho de uma unidade de desktop e cinco vezes o preço, seus 1 MB de dados são na verdade 10 e todas as outras diferenças, não há como você obter qualquer significado conclusões entre o preço do armazenamento da área de trabalho e o preço do armazenamento em nível empresarial.


3
Atualmente, as unidades SAS / SATA 7.2K de 2 a 4 TB são usadas para armazenamento em massa; portanto, parte disso não se aplica mais universalmente.
Mircea Chirea

11
As unidades do @MirceaChirea de 2 a 4 TB usadas no armazenamento corporativo são NL ou ML SAS e são diferentes dos discos de 2 a 4 TB SATA. O preço por GB ainda é muito diferente entre as duas plataformas.
precisa saber é o seguinte

@MDMarra, a maioria não é muito mais diferente do que suas variantes de desktop: além do SAS, elas têm melhor garantia e estão sujeitas à confiabilidade.
Mircea Chirea

11
Eles são especificados para uso 24x7, onde a maioria das unidades SATA não é. Eles também falham normalmente e não interrompem toda a matriz RAID . Somente discos SATA compatíveis com TLER falharão normalmente e evitarão isso. Também não há discos SATA de porta dupla, enquanto o SAS de porta dupla é comum e permitirá failover transparente dos controladores. Novamente, se você estiver com um orçamento limitado, a SATA pode ser sua única opção, mas existem diferenças consideráveis ​​com as quais as empresas se preocupam entre NL-SAS e SATA.
precisa saber é o seguinte

3
Backblaze disse em seu blog que as unidades da empresa não foram menos probabilidade de falhar do que as unidades de consumo
Bert

31

Não estou adicionando isso à resposta principal da CW, principalmente porque é uma diferença de opinião. Sinta-se livre para mesclar / editar isso, se desejar.

Freqüentemente, o motivo pelo qual o armazenamento em nível corporativo é tão caro pode ser que o solicitante não entende o requisito, mas às vezes também o administrador do sistema não entende o requisito, não pode comunicar o requisito a alguém com autoridade de compra ou está simplesmente obtendo ignorado pela referida autoridade.

Matrizes de armazenamento prontas para uso, de alta disponibilidade, alta disponibilidade e baixa manutenção são caras . Parte do trabalho de um projetista de sistemas é saber onde elas são apropriadas e onde um design diferente é apropriado.

Eu não acho que os custos relativos de diferentes tipos de unidades de disco sejam realmente relevantes para qualquer uma das perguntas de exemplo.

Por que tenho que pagar 50 dólares por mês por gigabyte extra de armazenamento?

Isso é claramente endereçado a um provedor de serviços de algum tipo. As duas respostas possíveis para minha mente são:

  1. Você tem cinco noves de atividade, suporte 24/7, em Manhattan / Londres / Hong Kong. Os pratos rotativos são apenas uma pequena parte da pilha pela qual você está pagando.

  2. Você está pagando demais. Negocie, troque de fornecedor ou traga-o para casa.

Nosso servidor de arquivos está sempre ficando sem espaço. Por que nosso administrador de sistemas não lança apenas uma unidade extra de 1 TB?

Este é quase certamente um projeto ruim (e provavelmente por razões políticas). Os dados nesse servidor de arquivos estão em algum lugar neste espectro:

  • Vale a pena armazenar dados em uma configuração de alto desempenho, alta disponibilidade e alto custo. O tempo de inatividade causado pela falta de espaço afeta sua alta disponibilidade e é uma falha de design ou planejamento.

  • Os dados não são importantes ou têm um desempenho lento ou um tempo de inatividade mais longo é aceitável. Discos baratos e soluções de backup baratas são aceitáveis. O tempo de inatividade regular devido à falta de espaço em disco ainda parece uma troca estranha, já que a maior parte do seu custo nesse caso provavelmente será o seu tempo de administrador de sistema e, a longo prazo, eles gastarão mais tempo solucionando problemas de baixo disco espaço.

Observe que eu disse que esse é um espectro, e a maioria dos requisitos está entre os dois.


5
Vale ressaltar que o que é do ponto de vista do usuário "ficar sem espaço" pode muito bem estar "preenchendo sua cota" do ponto de vista do administrador de sistemas.
Richard Gadsden

6

O custo de produção de qualquer item está diretamente conectado ao volume de unidades vendidas em um ciclo de feedback.

No caso de um disco rígido convencional, com vidro enferrujado e eletrônicos, existe potencialmente uma enorme variação no custo dos componentes mecânicos e eletrônicos - no entanto, duas faixas claras de preço / qualidade surgiram - Enterprise e Commodity.

No entanto, o volume reduzido de vendas de uma unidade corporativa exige muito do que você recebe pelo seu dinheiro - algo que custa sete vezes mais não será sete vezes melhor.

As unidades corporativas (para uma determinada capacidade) são um pouco mais rápidas que as unidades de commodities, por exemplo, comparando as unidades Seagate Barracuda SATA (commodity) e Cheetah SAS (enterprise):

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Porém, em um contexto corporativo, nenhum administrador de sistema sadio jamais armazenaria dados importantes em uma única unidade - o uso de várias unidades proporciona maior confiabilidade e largura de banda e reduz efetivamente a latência; quatro das unidades Barracuda configuradas como RAID10 serão muito mais rápidas que a única unidade Cheetah, com muito menos risco de perda de dados em cerca de 60% do preço.

Certamente, você obterá uma garantia melhor com a unidade Enterprise, e o fornecedor normalmente poderá obter uma para você no mesmo dia - mas você provavelmente poderá obter uma unidade de commodity de um fornecedor local mais rapidamente do que seu fornecedor remova o disco de substituição. Por outro lado, é mais provável que o disco corporativo seja um substituto exato para a unidade com falha.

Então, talvez você obtenha muito mais confiabilidade das unidades empresariais? Enquanto as pessoas que fabricam e vendem os discos costumam dizer que esse é o caso (a Seagate é bastante tímida sobre isso em seu site - mas mesmo os números ofuscados que eles publicam mostram que é menos que um fator de 2). Estudos independentes sugerem que não há diferença significativa .

O conjunto de comandos SCSI tem algumas vantagens técnicas sobre o conjunto de comandos ATA - particularmente em termos de permitir que o sistema operacional saiba exatamente o que está comprometido com o disco - no entanto, novamente, isso só faz uma diferença efetiva ao analisar o desempenho e a confiabilidade de um sistema de arquivos implementado em um único disco.

Se o seu provedor de serviços operar uma SAN Fibre Channel, o custo por Gigabyte de armazenamento será pelo menos 8 vezes maior do que comprar um disco disponível na loja de ferragens mais próxima. Mas existem outras abordagens que podem reduzir significativamente o custo.

Observe que isso nunca será mais barato do que comprar um disco de prateleira, pois você também está pagando por redundância, energia, ar condicionado e suporte, mas esses custos devem ser pequenos em relação ao custo da provisão de armazenamento.


5

Concordo com os outros posts sobre a qualidade do que uma empresa de hospedagem está oferecendo. Mas recentemente refizemos nosso contrato de hospedagem e compramos ao redor e ninguém era competitivo no espaço de armazenamento, nem os preços eram mais baixos do que o nosso contrato anterior de três anos. As unidades SAS estão caindo de preço, as prateleiras de discos / matrizes / SANs / FC / switches estão caindo, tudo está caindo de preço. Mas não armazenamento em disco?

Um colega com muito mais experiência apontou as táticas. O preço da CPU, memória e largura de banda era deslumbrante! Assine aqui! Inscreva-se agora e ignore esse problema de espaço em disco! Você não precisará de muito espaço em disco. Olhe para a CPU e memória!

Depois de se comprometer com o contrato deles, eles realmente o recebem e compõem sua receita no espaço em disco. Sim, é RAID-5 e alto desempenho, etc. mas os backups custam mais, a replicação externa custa mais.

Para empresas de hospedagem, é um modelo de negócios. A maioria das empresas faz algo semelhante com seus preços - reduza esse preço aqui, mas aumente o preço de lá para compensar sua receita em outro lugar. Eles também têm que pagar o aluguel e os salários.

Para servidores internos, você tem problemas diferentes. Você não pode simplesmente entrar em uma sala de servidores com a caixa Fedex que possui seu novo disco rígido de 3 TB. Se você planejou a expansão, é mais fácil, mas os servidores / racks / matrizes já podem estar em sua capacidade em termos de slots, E / S, placas controladoras e energia.

É como olhar debaixo de uma pedra, você ficará surpreso com o que pode encontrar.


O custo dos discos pode estar diminuindo, mas a mão-de-obra está aumentando. O CapEx não é a maior parte do TCO.
Chris S

5

Também é importante observar que o armazenamento 'local' pode custar mais do que você imagina.

Como parte de um exercício de como mover alguns de nossos dados 'arquivados' para a nuvem, concluí recentemente um exercício de preços comparando o custo do espaço em disco disponível (por exemplo, formatado em vez de bruto) disponível em nossa SAN mais recente com o custo de armazenamento no serviço de dados em nuvem da Amazon.

Considerando apenas o preço pago pela própria SAN, incluindo os discos, assumindo uma vida útil de 5 anos para o hardware da SAN, e não os custos indiretos da execução de nossa sala de servidores, nosso preço por 150 GB de armazenamento local é de US $ 31,88 por mês, contra os US $ 28,41 da Amazon ( assumindo uma taxa de tráfego por mês de 20% para cima e para baixo).

Agora não vou me apressar e mover todo o nosso armazenamento para a nuvem, porque há outros benefícios em ter armazenamento local, mas acho que esse tipo de exercício de preços é útil: se você acha que o armazenamento em nuvem é caro, quanto custa você está realmente pagando pelo seu armazenamento local?


4

Minha opinião sobre esta questão é simples IO ... um arquivo que fica em um único disco rígido de commodity, sem invasão e provavelmente sem troca a quente, e normalmente é acessado por uma pessoa e provavelmente nunca foi feito backup. Este é um método barato e fácil de IO ...

Em nossos negócios, usei um dos métodos mais caros de invasão (invasão 10) que requer um mínimo de 4 unidades; usamos 6 ... isso nos dá altas taxas de IO e tolerância a falhas.

Essa configuração salvou meu a $$ em grande forma, e esse resultado significou maior desempenho e menos tempo de inatividade para os usuários finais. Para E / S simples, há apenas uma pessoa para decepcionar e provavelmente há pouco valor financeiro associado ao tempo de inatividade.

Também temos um servidor iSCSI dedicado que é usado para virtualização Xen e que também está configurado para o ataque 10 ...

Quanto mais IO for necessário para uso e backup, mais caro será a implementação ... se o requisito da sua empresa aceitar perda de dados, velocidades muito lentas e sem redundância - o armazenamento da classe de negócios poderá ser feito no barato!!! Basta estar preparado para ser demitido ...

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.