Eu tenho uma série de greps, awks e seds que produzem uma lista de números, um em cada linha. Algo assim:
1.13
3.59
1.23
Como posso canalizar isso para algo que produzirá a média, max e min?
Eu tenho uma série de greps, awks e seds que produzem uma lista de números, um em cada linha. Algo assim:
1.13
3.59
1.23
Como posso canalizar isso para algo que produzirá a média, max e min?
Respostas:
Como você já está usando o awk
blahblahblah | awk '{if(min==""){min=max=$1}; if($1>max) {max=$1}; if($1<min) {min=$1}; total+=$1; count+=1} END {print total/count, max, min}'
awk
padrão acima /usr/local/bin/stats
ou algo assim e usá-lo como blabla | stats
.
Acho este programa útil para gerar estatísticas em listas de números na linha de comando: http://web.cs.wpi.edu/~claypool/misc/stats/stats.html
Há também simple-r, que pode fazer quase tudo o que R, mas com menos pressionamentos de tecla:
https://code.google.com/p/simple-r/
Para calcular a média, max e min, seria necessário digitar um dos seguintes:
r summary file.txt
r summary - < file.txt
cat file.txt | r summary -
Com uma ponta do chapéu para @DerfK:
perl -lane '$n=$F[0]; if(not defined $min){$min=$max=$n}; if($n>$max){$max=$n}; if($n<$min){$min=$n}; $total+=$n; $count+=1; END{print $total/$count." $max $min"}'
$F[0]
é o valor no primeiro (0'ésimo) campo de cada linha
Se seus dados de entrada estiverem separados por vírgula, adicione o -F,
modificador antes de-lane