[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
O "" servidor "" possui: 8 GByte RAM + 16 GByte SWAP, x> 300 GByte de espaço livre, amd64, CPU de desktop. Scientific Linux 6.6. Nada mais funciona para fazer LOAD. O awk é interrompido após alguns segundos .. out.txt é ~ 1,6 GByte. GNU Awk 3.1.7.
Pergunta : Como posso remover as linhas duplicadas, mantendo a ordem das linhas? Caso é importante também, por exemplo: "A" e "a" são duas linhas diferentes, tem que mantê-lo. Mas "a" e "a" são duplicados, apenas o primeiro é necessário.
A resposta pode estar em qualquer coisa .. se o awk não for bom para isso .. então perl / sed .. qual poderia ser o problema?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
Atualização: Eu tentei isso em uma máquina RHEL, ela não aborta, mas não tive tempo para esperar que ela terminasse. Por que o SL linux do SL difere do RHEL?
Atualização: Estou tentando um gues virtual do Ubuntu 14 .. até agora funciona! Não é um problema ulimit: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
versões em duas máquinas?
out.txt
? O mesmo comando funciona se você tentar em um arquivo menor? Quantos usuários na máquina? Havia memória disponível suficiente para o processo? Existe algo de especial na linha 8547098 do arquivo de entrada?