Sou estudante de graduação e o grupo em que trabalho mantém um cluster Linux. Cada nó do cluster possui seu próprio disco local, mas esses discos locais são relativamente pequenos e não estão equipados com backup automático. Portanto, o grupo possui um servidor de arquivos com muitos TBs de espaço de armazenamento. Sou um iniciante no Linux, portanto, não tenho certeza de quais são as especificações do servidor de arquivos em termos de velocidade, capacidade de rede, etc. Sei por experiência própria que os discos locais são significativamente mais rápidos que o servidor de arquivos em termos de E / S . Cerca de uma dúzia de pessoas usam o servidor de arquivos.
Usar cp
para copiar um arquivo de ~ 20 GB do servidor de arquivos para um dos discos locais leva em média 11,5 minutos em tempo real (de acordo com time
). Eu sei que essa cp
operação não é muito eficiente porque (1) time
me diz que o tempo do sistema para uma cópia desse tipo é de apenas ~ 45 segundos; e porque (2) quando examino top
durante a cópia, o % de CPU é bastante baixo (por inspeção, aproximadamente 0-10% em média).
Usar cp
para copiar o mesmo arquivo de ~ 20 GB de uma pasta no disco local para outra pasta no mesmo disco local leva menos tempo - cerca de 9 minutos em tempo real (~ 51 segundos no tempo do sistema, de acordo com time
). Então, aparentemente, o servidor de arquivos é um pouco mais lento que o disco local, como esperado, mas talvez não seja significativamente mais lento. Estou surpreso que copiar do local para o mesmo local não seja mais rápido que 9 minutos.
Preciso copiar ~ 200 arquivos grandes - cada ~ 20 GB - do servidor de arquivos para um dos discos locais. Então, minha pergunta é: Existe uma alternativa mais rápida cp
para copiar arquivos grandes no Linux? (Ou há alguma bandeira dentro da cp
qual eu possa usar que acelere a cópia?) Mesmo se eu pudesse, de alguma forma, economizar um minuto desse tempo de cópia, isso ajudaria imensamente.
Estou certo de comprar discos de hardware novos e mais rápidos, mas não tenho acesso a esses recursos. Também não sou administrador de sistema - sou apenas um usuário (iniciante) -, portanto, não tenho acesso a informações mais detalhadas sobre a carga que está nos discos. Sei que, embora cerca de uma dúzia de pessoas use o servidor de arquivos diariamente, sou a única pessoa que usa esse nó / disco local específico.
dd
e rsync
comparar qual delas funciona mais rápido em seu ambiente
dd
, mas apenas tentei rsync
. O tempo real foi de cerca de 11,5 minutos e o tempo do sistema foi de cerca de 1,5 minutos, de acordo com time
.
/dev/sda1
para /dev/sdb1
será mais rápido do que copiar de um local /dev/sda1
para outro local /dev/sda1
ou de outra partição, /dev/sda
porque o disco rígido não precisará fazer buscas adicionais entre leituras e gravações (assumindo discos rígidos tradicionais com discos giratórios e cabeças em movimento; SSD é obviamente diferente).