Respostas:
A redução de redundância é onde você analisa o conteúdo de um conjunto de dados, anota todos os bits duplicados presentes e armazena os dados apenas uma vez, substituindo todas as cópias de dados com um ponteiro de volta para a única cópia. Isso é particularmente útil nos backups, porque quando você faz backup de coisas como servidores, muitos dados são iguais. Imagine, por exemplo, que você esteja fazendo backup de 1.000 servidores Windows - grande parte do conteúdo dessas caixas será idêntica.
A desduplicação é hoje tão popular por 3 razões:
Ultimamente, todo mundo está obcecado em criar soluções de recuperação de desastres que utilizam servidores externos. Para fazer isso, é necessário replicar muitos dados de produção no site remoto e a largura de banda é um grande problema. Qualquer redução na quantidade de dados que você precisa replicar ajuda muito.
A quantidade de dados que as empresas estão retendo está explodindo - graças ao armazenamento mais barato e aos requisitos de vários setores para retenção de registros.
A tecnologia atingiu recentemente o ponto ideal. Tivemos coisas como desduplicação por um longo tempo (armazenamento de instância única, etc.), o que ajudou, mas apenas no último ano, vimos a desduplicação real que pode reduzir significativamente a quantidade de armazenamento atingida pelo mainstream.
Uma das coisas que descobrimos na minha empresa ao trabalhar com a Netapp é que a desduplicação realmente só funciona bem em um ambiente de VM se você tiver suas unidades alinhadas. O que é um problema para nós, pois temos muitas máquinas com Windows Server 2003 e nenhuma das unidades está alinhada. O que significa que você mal recupera cerca de um quarto do espaço possível se as unidades estiverem alinhadas corretamente.
No entanto, somos informados de que, assim que as unidades estiverem alinhadas corretamente, poderemos recuperar de 40 a 60% do nosso espaço com deduplicação.