Basicamente, estou pesquisando para ver se existe uma ferramenta ou script que pode detectar arquivos movidos ou renomeados, para que eu possa obter uma lista de arquivos renomeados / movidos e aplicar a mesma operação na outra extremidade da rede para economizar largura de banda.
Basicamente, o armazenamento em disco é barato, mas a largura de banda não, e o problema é que os arquivos geralmente são reorganizados ou movidos para uma estrutura de diretórios melhor, portanto, quando você usa o rsync para fazer o backup, o rsync não notará que é renomeado ou arquivo movido e retransmiti-lo pela rede novamente, apesar de ter o mesmo arquivo do outro lado.
Então, eu estou me perguntando se existe um script ou ferramenta que possa gravar onde estão todos os arquivos e seus nomes; logo antes de um backup, ele examinaria novamente e detectaria arquivos movidos ou renomeados, para que eu possa pegar essa lista e reaplicar a operação de mover / renomear do outro lado.
Aqui está uma lista dos recursos "gerais" dos arquivos:
- Arquivos grandes e imutáveis
- Eles podem ser renomeados ou movidos
[Editar:] Todas essas são boas respostas, e o que eu acabei fazendo no final foi analisar todas as respostas e estará escrevendo algum código para lidar com isso. Basicamente, o que estou pensando / trabalhando agora é:
- Usar algo como o AIDE para a verificação "inicial" e permitir que eu mantenha somas de verificação nos arquivos porque eles nunca devem mudar, portanto, isso ajudaria na detecção de corrupção.
- Criando um daemon inotify que monitore esses arquivos / diretório e registre quaisquer alterações relacionadas a renomeações e mova os arquivos para um arquivo de log.
- Existem alguns casos extremos em que o inotify pode falhar ao registrar que algo aconteceu com o sistema de arquivos, portanto, há uma etapa final de usar find para procurar no sistema de arquivos por arquivos com um tempo de alteração posterior ao último backup .
Isso tem vários benefícios:
- Soma de verificação / etc da AIDE para poder verificar / certificar-se de que algumas mídias não foram corrompidas
- O Inotify mantém baixo o uso de recursos e não é necessário verificar novamente o sistema de arquivos repetidamente
- Não há necessidade de corrigir o rsync; Se eu precisar consertar as coisas que puder, mas preferiria evitar consertar as coisas para manter a carga mais baixa (o IE não precisa corrigir novamente sempre que houver uma atualização).
- Eu usei o Unison antes e é muito bom, no entanto, eu poderia jurar que o Unison mantém cópias no sistema de arquivos e que seus arquivos "archive" podem crescer bastante grandes?