Por que existem caracteres separados de largura fixa para ０-９ em japonês, em comparação com o típico 0-9?

9

Japonês (日本語) -０１２３４５６７８９

ASCII típico para qualquer outro lugar - 0 1 2 3 4 5 6 7 8 9

Por que havia a necessidade de criar um conjunto de caracteres separado para os mesmos números?

unicode ascii

— Zaenille
fonte

11

Esses são caracteres de largura total .

Esses caracteres, que estão no Unicode U + FF00 a U + FFEF, devem ser usados com caracteres CJK. Eles existem para que os caracteres latinos possam se alinhar com o texto CJK de largura fixa. Historicamente, os caracteres Han foram definidos com largura dupla nos terminais 80x24 e esses caracteres foram usados para corresponder à largura do texto CJK.

Esses caracteres não se limitam a numerais. O alfabeto latino completo está disponível na forma de largura total.

ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺ
ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ
０１２３４５６７８９

Prompt de comando no Windows mostrando formulários de largura total para caracteres latinos ao lado de caracteres Han
^{Fonte da imagem}

— bwDraco
fonte

3

Esses caracteres de largura total não são apenas para japonês, mas também para coreano e chinês, porque possuem um conjunto de caracteres de largura dupla (também conhecido como largura total). Devido à sua complexidade visual e à baixa resolução de tela do passado, não era possível fisicamente exibir esses idiomas em caracteres de meia largura - especialmente para caracteres coreanos e chineses.

(O japonês também possui caracteres de meia largura, mas em japonês é um pouco raro usar apenas caracteres japoneses. Geralmente ele vem com caracteres chineses misturados. Portanto, ter caracteres de meia largura não ajuda muito.)

Esses caracteres numéricos de tamanho grande foram introduzidos para isso. Quando eles estavam escrevendo, por exemplo, uma tabela ou texto no estilo de grade sem usar gráficos, caracteres numéricos típicos não se misturavam bem. Além disso, eles tinham culturas de "escrita vertical", bem como escrita horizontal que usamos agora. Imagine que, se você escrever esses caracteres verticalmente, os caracteres numéricos convencionais provavelmente parecerão feios quando misturados.

Coisas semelhantes estavam acontecendo no lado da estrutura de dados também porque os caracteres de meia largura ocupavam 1 byte cada, enquanto os caracteres de largura total ocupavam 2 bytes ou mais.

Fazer com que a maioria dos personagens ocupe o mesmo espaço e a memória simplificou muitas coisas como essas. Da mesma forma, também existem caracteres romanos de largura total.

Eu meio que entendo por que você fez essa pergunta - hoje em dia, tudo está na GUI. As tabelas não são mais puramente escritas em textos. Os escritos verticais estão se tornando obsoletos. Para ter caracteres mais largos, podemos apenas ajustar a largura em vez de usar caracteres gordos. A maioria dos caracteres ocupa vários bytes de qualquer maneira, à medida que são introduzidas codificações mais complexas. Talvez seja verdade que esses caracteres alfanuméricos de largura total sejam uma espécie de herança da velhice, como a tecla "Scroll Lock" no teclado.

— Scott Rhee
fonte

0

Eu acredito que tem a ver com a largura dos caracteres e o japonês é um desses idiomas em que você pode digitar verticalmente.

— Nelson
fonte