(supondo que você esteja se referindo ao uso de deduplicação no ZFS versus seu software de backup)
Eu não recomendaria o uso da deduplicação nativa do ZFS para o seu sistema de backup, a menos que você projete seu sistema de armazenamento especificamente para ele.
O uso da desduplicação no ZFS consome muita RAM. Como a desduplicação ocorre em tempo real, à medida que os dados são transmitidos / gravados no pool de armazenamento, há uma tabela mantida na memória que controla os blocos de dados. Esta é a tabela DDT . Se o seu servidor de armazenamento ZFS não tiver RAM suficiente para acomodar esta tabela, o desempenho sofrerá tremendamente. A Nexenta irá avisá-lo quando a tabela ultrapassar um certo limite, mas a essa altura já é tarde demais. Isso pode ser aumentado pelo uso de um dispositivo L2ARC (cache de leitura), mas muitos dos primeiros usuários do ZFS caíram nessa armadilha.
Vejo:
ZFS - a destruição do zvol desduplicado ou do conjunto de dados interrompe o servidor. Como recuperar?
ZFS - Impacto da falha do dispositivo de cache L2ARC (Nexenta)
Quando digo que o requisito de RAM é alto para usar a desduplicação, eu estimaria as necessidades de RAM e L2ARC para o conjunto de dados que você está descrevendo em 64GB + RAM e 200GB + L2ARC. Isso não é um investimento menor. Manter muitos arquivos do sistema Windows e documentos de imagem que não serão relidos, preencherá o DDT muito rapidamente. A recompensa pode não valer o trabalho de engenharia que precisa ser feito antecipadamente.
Uma idéia melhor é usar a compactação no zpool, possivelmente aproveitando os recursos gzip para os tipos de dados mais compactáveis. A desduplicação não valerá a pena, pois há um problema quando você precisa excluir dados desduplicados (precisa fazer referência ao DDT).
Além disso, como você apresentará o armazenamento para o seu software de backup? Qual pacote de software de backup você usará? Em ambientes Windows, apresento o ZFS como armazenamento em bloco no Backup Exec sobre iSCSI. Nunca achei que os recursos do ZFS CIFS fossem robustos o suficiente e preferi as vantagens de um dispositivo com formato nativo.
Além disso, aqui está um excelente recurso do ZFS para idéias de design. Coisas sobre o ZFS que ninguém lhe disse