Qual é o limite de escalabilidade razoável de 'sort -u'? (nas dimensões "comprimento da linha", "quantidade de linhas", "tamanho total do arquivo"?)
Qual é a alternativa do Unix para arquivos que excedem isso na dimensão "quantidade de linhas"? (É claro que posso implementar facilmente um, mas me perguntei se há algo que pode ser feito com poucos comandos padrão do Linux.)
uniq
antes da sort -u
ajuda. BTW, para dados ASCII LC_ALL=C sort
acelera GNU sort
um lote terrível (veja esta resposta )