Você pode usar R
para calcular rapidamente a média, desvio padrão e outros valores interessantes.
Por exemplo, você pode usar o tempo GNU para gravar várias medidas de tempo de execução em um arquivo CSV:
function measure
{
f=$1; shift
n=$2; shift
echo wall,user,sys,rss > "$f"
for i in $(seq $n); do
/usr/bin/time --output "$f" --append --format '%e,%U,%S,%M' "$@" >/dev/null
done
}
Então você pode gerar os valores com R assim:
Rscript --vanilla -e "b=read.csv(file='$f');summary(b);sapply(b, sd);"
Eu criei um pequeno script de benchmark que também faz algumas impressões bonitas da saída R, por exemplo:
$ benchmark.sh 100 ./some_prog arg1 arg2
n=100 | min | Q1 | med | mean | Q3 | max | std
wall | 0.0400 | 0.0400 | 0.0500 | 0.0471 | 0.0500 | 0.0800 | 0.00624
user | 0.0400 | 0.0400 | 0.0400 | 0.0426 | 0.0400 | 0.0700 | 0.00562
sys | 0 | 0 | 0 | 0 | 0 | 0 | 0.00000
rss | 2608 | 2657 | 2704 | 2728 | 2764 | 2920 | 95.06524
os.system()
, causa a sobrecarga de chamar / criar um shell com cada comando. Provavelmente é melhor usar subprocess.call ()