Experimente o utilitário unicode :
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
Ou o uconv
utilitário do pacote ICU :
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
Você também pode obter informações através do recode
utilitário:
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
Ou com Perl:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
Observe que eles fornecem informações sobre os caracteres que compõem esse glifo, não sobre o glifo como um todo. Por exemplo, para é
(e com combinação de sotaque agudo):
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
Diferente do caractere autônomo é:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
Você pode pedir uconv
para recombinar aqueles (para aqueles que têm um formulário combinado):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(é uma forma combinada, mas não b).
unicode
? Parece que não o tenho instalado (e não consigo encontrá-lo nos repositórios do Arch Linux). Além disso, o que diabos éexclarrogatif
? [EDIT: Eu entendo isso, também aqui, embora o meu sistema não é francês.]