Eu uso o GNU SED há alguns anos. Às vezes, isso me deixa meio confuso, mas faz um bom trabalho ... para conjuntos de caracteres de byte único!
De vez em quando, noto referências ao GNU SED que reconhece Unicode, mas o mais próximo que eu vi disso é seu modo "binário". E binário não é Unicode.
O GSED pode processar um arquivo de texto Unicode na resolução do CodePoint, incluindo e especialmente \ r \ n (Windows) ... e, se puder, espera UTF-8, UTF-16 ou o quê? e como o SED detecta a codificação?