HDD ainda é bastante preferido, mas por quê?
Isso depende de com quem você conversa, seus antecedentes (gerenciamento, TI, vendas, etc.) e que tipo de servidor a discussão se refere. Os HDDs geralmente são uma ordem de magnitude mais barata por byte, mas consomem mais energia e quase sempre são mais lentos, dependendo da carga de trabalho.
Quase sempre, o custo e a quantidade de armazenamento podem caber em uma determinada quantidade de servidores. Se você pode obter o desempenho de uma matriz de invasões de 5 discos com um único SSD, o SSD provavelmente é muito mais barato e usa uma fração da energia, mas você também terá talvez 1/10 do armazenamento.
Qual é o melhor para armazenamento ativo?
É aqui que fica complicado, e por que muitas pessoas ignoram a complicação e apenas seguem os HDDs que conhecem.
Os SSDs vêm em diferentes graus, com limites para a quantidade de dados que podem ser gravados nas células, o que NÃO é igual à quantidade de dados gravados pelo host. Escrever pequenas quantidades de dados acaba gravando grandes quantidades nas células, isso é chamado de amplificação de gravação e pode rapidamente matar unidades com baixas classificações de resistência.
As células SSD são nomeadas para a quantidade de bits que podem armazenar; para armazenar n bits, elas precisam de 2 ^ n níveis de voltagem por célula. Um TLC (bit triplo) precisa de 8 níveis de tensão para endereçar esses bits. Geralmente, cada vez que você aumenta o nível de bits por célula, obtém uma queda de 3-10X na durabilidade da célula. Por exemplo , uma unidade SLC pode gravar todas as células 100000 vezes antes de as células morrerem, eMLC corporativo 30000 vezes, MLC 10000, TLC 5000, QLC 1000.
Há também melhorias geracionais na tecnologia de células SSD, melhor litografia e NAND 3D, melhorando a densidade e o desempenho em relação ao NAND 2D mais antigo: "O MLC de hoje é melhor que o SLC de ontem", conforme citado pelo analista Jim Handy .
Na verdade, os SSDs não gravam diretamente em células endereçadas, eles gravam em blocos de células. Dessa forma, o bloco possui uma quantidade mais consistente de gravações de células e, quando as células perdem a tolerância, o bloco inteiro é marcado como ruim e os dados são movidos para um novo bloco. A resistência do SSD é baseada no tipo de célula, quantos blocos sobressalentes estão disponíveis, quanta sobrecarga para correção de erros e como o inversor usa cache e algoritmos para reduzir a amplificação de gravação. A tolerância que o fabricante seleciona para marcar como ruim também entra em jogo, uma unidade corporativa marcará blocos ruins antes de uma unidade de consumidor, mesmo que um deles ainda esteja totalmente funcional.
Os SSDs de "gravação alta" de nível corporativo são baseados em células SLC ou eMLC e possuem grandes quantidades de blocos sobressalentes e geralmente possuem um cache grande com capacitores para garantir que o cache possa ser liberado no disco quando a energia for perdida.
Também existem unidades com resistência muito menor para aplicativos de "alta leitura", como servidores de arquivos que precisam de tempos de acesso rápidos; custam menos por byte pelo preço da resistência reduzida, com diferentes tipos de células, menos área livre e assim por diante. podem ter apenas 5% da resistência de uma unidade de "gravação alta", mas também não precisam dela quando usada corretamente.
Por exemplo, para banco de dados, onde o disco está ativo o tempo todo?
Meu banco de dados é pequeno, com leituras intermitentes sendo 95% de acesso, e a maioria é armazenada em cache na RAM, é quase tão rápida em um HD quanto em SSD. Se fosse maior, não haveria RAM suficiente no sistema e o SSD começa a fazer uma enorme diferença nos tempos de acesso.
Os SSDs também tornam mais rápidos os pedidos de backup e recuperação de magnitude. Meu banco de dados foi restaurado do backup em cerca de 10 minutos para um SSD lento, ou cerca de 11 segundos para um realmente rápido, o backup em um HDD teria durado cerca de 25 minutos. São pelo menos duas ordens de magnitude e isso pode fazer uma enorme diferença dependendo da carga de trabalho. Ele pode literalmente se pagar no dia 1.
Bancos de dados com grandes quantidades de pequenas gravações podem matar uma unidade TLC de qualidade de consumidor em questão de horas.
E o SSD é realmente útil para o servidor?
Absolutamente, se o tipo e o grau corretos de unidade forem selecionados para o aplicativo, se você fizer errado, pode ser um desastre.
Meu servidor executa vários bancos de dados, além de armazenamento em rede de alta leitura, armazenamento de imagens com segurança de gravação alta, armazenamento de arquivos de gravação e leitura mista e backup do cliente. O servidor possui uma matriz RAID-6 de HDDs para armazenamento em rede em massa e NVR, um único SSD MLC de alto desempenho para MySQL e três unidades TLC de consumidor em RAID-5 para backups de clientes e bancos de dados e acesso rápido ao armazenamento em rede.
A velocidade de gravação no SSD RAID é aproximadamente a mesma do HDD RAID, mas a velocidade de leitura de acesso aleatório é 10 vezes mais rápida no SSD RAID. Mais uma vez, este é um SSD TLC de consumidor, mas como a velocidade de gravação sequencial é cerca de 3X mais rápida que a LAN de gigabit, ela nunca é sobrecarregada e há muita sobrecarga se o sistema fizer backups locais quando estiver sendo acessado remotamente.
A maioria dos SSDs também oferece apagamento seguro instantâneo (ISE) , que pode limpar os dados em alguns segundos, em comparação a muitas horas ou dias dos HDDs que não possuem esse recurso, apenas alguns HDDs de nível empresarial tendem a oferecer ISE, mas estão se tornando mais comum. Isso é muito útil se você estiver desativando ou redefinindo uma unidade.
Qual é a melhor solução (sistema de arquivos) para escrever?
Depende do tipo de dados e dos tipos de recursos do sistema de arquivos que você deseja. Estou usando apenas EXT4 e BTRFS (preciso de instantâneos e somas de verificação). A sobrecarga do sistema de arquivos diminui o espaço utilizável e pode reduzir um pouco a vida útil dos SSDs, o BTRFS possui uma alta sobrecarga para somas de verificação e outros recursos, e os instantâneos usam muito espaço.
Em caso de falha mecânica, não há como repará-lo (está correto)?
Independentemente do tipo de unidade, você já teve que realizar a recuperação de dados em uma unidade morta? Pode ser muito caro , é melhor ter um backup em camadas, RAID no armazenamento principal, backups com versão localmente em um dispositivo ou máquina diferente e sincronizar com o local ou a nuvem. 1 TB de armazenamento em nuvem custa US $ 5 por mês, a recuperação de dados em um disco rígido pode custar 2 mil e um SSD morto pode ser impossível de recuperar ... basta fazer os backups e esquecer o reparo.