TLDR
A pergunta original não era clara e lia-se que o OP simplesmente desejava uma versão exclusiva do conteúdo de um arquivo. Isso é mostrado abaixo. Na forma atualizada da pergunta, o OP agora está declarando que ele / ela simplesmente deseja saber se o conteúdo do arquivo é único ou não.
Teste se o conteúdo do arquivo é único ou não
Você pode simplesmente usar sort
para verificar se um arquivo é exclusivo ou contém duplicatas como:
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Exemplo
Digamos que eu tenho esses dois arquivos:
arquivo de amostra duplicado
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
arquivo de amostra exclusivo
$ cat uniq_input.txt
A
B
C
D
Agora, quando analisamos esses arquivos, podemos dizer se eles são únicos ou contêm duplicatas:
arquivo de duplicatas de teste
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
arquivo exclusivo de teste
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Pergunta original (conteúdo exclusivo do arquivo)
Pode ser feito com apenas sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680