Eu gostaria de saber o equivalente a
cat inputfile | sed 's/\(.\)/\1\n/g' | sort | uniq -c
apresentado em /programming/4174113/how-to-gather-characters-usage-statistics-in-text-file-using-unix-comands para produção de estatísticas de uso de caracteres em arquivos de texto para contagem de arquivos binários bytes simples em vez de caracteres, ou seja, a saída deve estar na forma de
18383 57
12543 44
11555 127
8393 0
Não importa se o comando leva tanto tempo quanto o comando referenciado para caracteres.
Se eu aplicar o comando para caracteres em arquivos binários, a saída conterá estatísticas para seqüências longas arbitrárias de caracteres não imprimíveis (não busco explicações para isso).
| sort -n
e| sort -n -r
por ordem decrescente, respectivamente (a classificação não fazia parte da pergunta). A classificação pode ser melhor ...