Como posso usar awk
na seguinte situação?
Quero concatenar linhas que começam com a mesma coluna. Apenas a primeira coluna é mantida após a juntar-se (neste caso aaa
, www
, hhh
).
O arquivo pode ser separado por espaço ou tabulação.
Exemplo de entrada:
aaa bbb ccc ddd NULL NULL NULL
aaa NULL NULL NULL NULL NULL NULL
aaa bbb ccc NULL NULL NULL NULL
www yyy hhh NULL NULL NULL NULL
hhh 111 333 yyy ooo hyy uuuioooy
hhh 111 333 yyy ooo hyy NULL
Saída desejada:
aaa bbb ccc ddd NULL NULL NULL NULL NULL NULL NULL NULL NULL bbb ccc NULL NULL NULL NULL
www yyy hhh NULL NULL NULL NULL
hhh 111 333 yyy ooo hyy uuuioooy 111 333 yyy ooo hyy NULL
O pano de fundo disso é que eu quero configurar um banco de dados baseado em arquivo muito simples, em que a primeira coluna seja sempre o identificador da entidade. Todas as linhas baseadas na mesma coluna identificadora são concatenadas.
uuu
linha (na saída)?