Esta resposta foi editada depois que a pergunta foi esclarecida.
Quais são as outras razões pelas quais as nuvens preferem o DAS
Onde "DAS" significa armazenamento conectado direto, ou seja, unidades de disco rígido SATA ou SAS.
Todos os fornecedores de nuvem usam o DAS porque oferecem melhorias de preço / desempenho em ordem de magnitude. É um caso de dimensionamento horizontal .
Em resumo, unidades de disco rígido SATA e controladores SATA são mercadorias baratas. São produtos de mercado de massa e têm preços muito baixos. Ao criar um grande conjunto de PCs baratos com unidades SATA baratas, o Google, a Amazon e outros obtêm grande capacidade a um preço muito baixo. Eles então adicionam sua própria camada de software na parte superior. Seu software faz replicação multi-servidor para desempenho e confiabilidade, monitoramento, reequilíbrio da replicação após falha de hardware e outras coisas.
Você pode dar uma olhada no MogileFS como um representante mais simples do tipo de software que o Google, a Amazon e outros usam para armazenamento. É uma implementação diferente, é claro, mas compartilha muitos dos mesmos objetivos e soluções de design que os sistemas de grande escala. Se você quiser, aqui está um ponto de partida para aprender mais sobre o GoogleFS .
declarado posteriormente neste documento, as nuvens devem usar SAN ou NAS por causa do DAS não ser apropriado quando uma VM se move para outro servidor
Existem 2 razões pelas quais as SANs não são usadas.
1) Preço.
As SANs são extremamente caras em larga escala. Embora possam ser a melhor solução tecnicamente, geralmente não são usadas em instalações de grande escala devido ao custo.
2) O teorema da CAP Teorema da CAP de
Eric Brewer mostra que em uma escala muito grande você não pode manter uma consistência forte, mantendo confiabilidade, tolerância a falhas e desempenho aceitáveis. As SANs são uma tentativa de obter forte consistência no hardware. Isso pode funcionar bem para uma instalação de 5.000 servidores, mas nunca foi comprovado que funcione para os mais de 250.000 servidores do Google.
Resultado:
até agora, os fornecedores de computação em nuvem optaram por aumentar a complexidade da manutenção do estado do servidor para o desenvolvedor do aplicativo. As ofertas atuais da nuvem não fornecem um estado consistente para cada máquina virtual. Os servidores de aplicativos (máquinas virtuais) podem falhar e seus dados locais podem ser perdidos a qualquer momento.
Cada fornecedor tem sua própria implementação de armazenamento persistente, que você deve usar para dados importantes. As ofertas da Amazon são bons exemplos; MySQL , SimpleDB e Simple Storage Service . Essas ofertas refletem o teorema do CAP - a instância do MySQL tem uma consistência forte, mas uma escalabilidade limitada. O SimpleDB e o S3 são dimensionados de maneira fantástica, mas acabam sendo consistentes.