Eu tenho alguma saída na forma de:
count id type
588 10 | 3
10 12 | 3
883 14 | 3
98 17 | 3
17 18 | 1
77598 18 | 3
10000 21 | 3
17892 2 | 3
20000 23 | 3
63 27 | 3
6 3 | 3
2446 35 | 3
14 4 | 3
15 4 | 1
253 4 | 2
19857 4 | 3
1000 5 | 3
...
O que é bastante confuso e precisa ser limpo em um CSV para que eu possa presenteá-lo a um gerente de projeto para eles a planilha.
O núcleo do problema é este: preciso que a saída seja:
id, sum_of_type_1, sum_of_type_2, sum_of_type_3
Um exemplo disso é o ID "4":
14 4 | 3
15 4 | 1
253 4 | 2
19857 4 | 3
Em vez disso, deve ser:
4,15,253,19871
Infelizmente, sou um lixo nesse tipo de coisa, consegui limpar todas as linhas e entrar no CSV, mas não consegui desduplicar e agrupar as linhas. Agora eu tenho isso:
awk 'BEGIN{OFS=",";} {split($line, part, " "); print part[1],part[2],part[4]}' | awk '{ gsub (" ", "", $0); print}'
Mas tudo o que faz é limpar os caracteres do lixo e imprimir as linhas novamente.
Qual é a melhor maneira de massagear as linhas na saída mencionada acima?