Depende do seu objetivo.
Se você estiver procurando por backups para recuperação de desastres (servidor explodido, data center queimado etc.), a resposta curta é que eles podem não fazer backups. Temos um cliente que lida com dados confidenciais do governo e parte de seu mandato é que não temos permissão para fazer backups ou backups em mídia removível . Temos permissão de replicação ao vivo para um site de recuperação de desastres e é isso. Ambos os sites são cobertos no mesmo nível de segurança física e lógica. O problema aqui é que, se eu estragar algo no Site A, ele é replicado no Site B quase que instantaneamente.
Se você está falando de backups do ponto de vista da integridade dos dados (por exemplo, você soltou acidentalmente a tabela Customers e ela já foi replicada no site de recuperação de desastres), as fitas LTO-5 em uma grande biblioteca de fitas geralmente estão em movimento. Com até 3 TB por fita e várias fitas em uma biblioteca de fitas, você pode fazer backup rápido de grandes quantidades de dados (rápido aqui se refere a Mbps, ainda pode levar muitas e muitas horas para fazer backup de 25 TB de dados).
Qualquer suíte de backup decente fará alta compactação e remoção de duplicação, o que reduz bastante a quantidade de espaço de armazenamento necessário. Vi uma estimativa de uma ferramenta de backup do Exchange compactada e desduplicada, uma vez que reivindicava uma proporção de 15: 1 (15 GB de dados armazenados em 1 GB de backups).
Duvido muito que o Google se preocupe com os backups de muitos dos dados de seus mecanismos de pesquisa, porque a maioria deles é substituível e está distribuída tão longe que, se eles perderem uma parte significativa ou talvez um datacenter inteiro, o sistema permanecerá online graças às rotas BGP de failover.
Na verdade, parece que o Google faz backup de uma tonelada de dados métrica em fita , o que não é exatamente o que eu estava esperando: