xargs
é rápido :
#!/usr/bin/bash
echo "while loop:"
n=0; time while (( n++ < 10000 )); do /usr/bin/true ; done
echo -e "\nfor loop:"
time for ((n=0;n<10000;n++)); do /usr/bin/true ; done
echo -e "\nseq,xargs:"
time seq 10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nyes,xargs:"
time yes x | head -n10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nparallel:"
time parallel --will-cite -j1 -N0 /usr/bin/true ::: {1..10000}
Em um Linux moderno de 64 bits, fornece:
while loop:
real 0m2.282s
user 0m0.177s
sys 0m0.413s
for loop:
real 0m2.559s
user 0m0.393s
sys 0m0.500s
seq,xargs:
real 0m1.728s
user 0m0.013s
sys 0m0.217s
yes,xargs:
real 0m1.723s
user 0m0.013s
sys 0m0.223s
parallel:
real 0m26.271s
user 0m4.943s
sys 0m3.533s
Isso faz sentido, pois o xargs
comando é um único processo nativo que gera o /usr/bin/true
comando várias vezes, em vez dos loops for
e while
que são interpretados no Bash. Claro que isso só funciona para um único comando; se você precisar executar vários comandos em cada iteração do loop, será tão rápido, ou talvez mais rápido, do que passarsh -c 'command1; command2; ...'
para xargs
Também -P1
pode ser alterado para, digamos,-P8
gerar 8 processos em paralelo para obter outro grande aumento de velocidade.
Não sei por que o GNU paralelo é tão lento. Eu teria pensado que seria comparável ao xargs.
let ++n
vez den=$((n+1))
(3 caracteres a menos).