Eu tenho pesquisado sobre isso, bastante engraçado.
Seus backups para o S3 podem falhar dependendo da sua região devido à consistência eventual; o aviso básico é que, se você fizer isso o suficiente, em algum momento ocorrerá erros ao abrir ou localizar arquivos, pois a mágica do sistema de arquivos no fundo da Amazon é sincronizada entre os servidores; portanto, seus backups podem não ser confiáveis.
Quanto à necessidade de salvá-los de outra maneira, isso depende do seu gerenciamento de riscos. Você confia na Amazon para armazenar seus dados?
É possível que eles percam alguma coisa ou tenham uma falha maior no sistema de armazenamento; sem dúvida, eles têm cláusulas nos contratos especificando que, se perderem seus dados, isso é problema seu . Não deles. Além disso, como seus dados estão armazenados em outro lugar, você não sabe o que eles farão com eles; aplicação da lei quer seus dados? Você pode nem saber que outra pessoa acessou.
Você confia nisso? Se os dados não são essenciais para os seus negócios e você está disposto a aceitar esse risco, não há necessidade de fazer o download para armazenamento externo. Se você não estiver disposto a arriscar que seus dados estejam seguros nos servidores de armazenamento da Amazon, você deve tomar providências para despejá-los periodicamente em seu próprio armazenamento.
Em outras palavras, acho que não há uma resposta direta para isso, pois depende de sua tolerância a riscos e necessidades de negócios. Muitas pessoas não confiariam completamente sua renda apenas no armazenamento na nuvem, pessoalmente, me sinto um pouco cauteloso com isso ...
Para fazer isso melhor, em discussões e pesquisas, outra abordagem a considerar é a criação de um volume EBS grande o suficiente para armazenar os dados, anexá-lo à instância do EC2, salvar seus dados lá e desmontar o volume e salvá-los no S3 . Estou no meio da pesquisa se isso seria feito para salvar o próprio arquivo de volume no S3 ou o conteúdo ... mas você pode excluir a instância do EBS quando terminar para economizar custos de armazenamento.
EDIT Vejo na releitura que você está salvando do S3 para a instância do EC2, e não vice-versa (embora eu não saiba se o eventual problema de consistência ainda pode causar problemas). Você está tentando salvar dados em uma instância do EC2 como backup? Eu pensaria que em termos de custo isso não é uma tática sólida; pode ser mais barato fazer o backup de uma unidade local quando você considera o armazenamento de longo prazo desse tipo de dados, juntamente com o tempo da VM. Com os custos de unidade, você pode copiar os dados para um disco local como backup.
Eu ainda manteria os avisos sobre confiar na Amazon e em seu armazenamento. Se você deseja manter tudo no Amazon S3, mas tem mais redundância, duplique seus buckets S3 entre regiões e, se houver uma interrupção que afeta uma região, ela não deve eliminá-los. Você esperaria. Tudo é possível, no entanto.
Tudo se resume a quanto você valoriza seus dados, quanto você está disposto a pagar por eles e quanto risco deseja tolerar.