Geral
Esses caracteres não se destinam a texto regular em alfabeto latino, mas a fonética, texto em alfabeto cirílico, para uso como símbolos matemáticos (representando variáveis) ou similares. A única maneira compatível com Unicode de codificar texto no alfabeto latino básico é usar os caracteres predominantemente usados para esse fim (ou seja, do bloco Unicode latino básico ).
Como em muitos outros padrões, você deve pensar duas vezes em violar o Unicode. Além disso, o Unicode compreende tantos sistemas de escrita, casos de uso e outras coisas que existem apenas para compatibilidade retroativa com outros padrões 1, que compreender completamente todas as suas motivações é uma ciência própria. Para encurtar a história, a menos que você realmente saiba realmente o que está fazendo, é extremamente provável que algo quebre que você nem tenha remotamente pensado.
Exemplos específicos
Acessibilidade
O texto codificado não existe apenas para ser renderizado em alguma fonte. Também pode ser interpretado, por exemplo, por leitores de tela. E um leitor de tela não precisa adivinhar se
𝓽𝓱𝓮
deve ser o artigo definido ou o produto matemático 2 das variáveis 𝓽, 𝓱 e 𝓮 - e é para isso que esses caracteres são feitos. O melhor comportamento será, portanto, que ele explique esses caracteres, por exemplo, dizendo literalmente o seguinte:
negrito script pequeno t, negrito script pequeno h, negrito script pequeno e
Não deveria apenas dizer "o", porque, em vez disso, não leria adequadamente textos matemáticos cujos símbolos formam uma palavra pronunciável. 3
Portabilidade
Se o seu texto for bem renderizado na sua máquina, isso não significa que também estará na do leitor. O exemplo mais óbvio é que o leitor não possui nenhuma fonte que suporte esses caracteres ou o texto é renderizado por um software que não suporta fontes de fallback. É certo que isso está se tornando cada vez menos comum. Porém, lembre-se de que algumas pessoas como disléxicos precisam de fontes especiais com menor probabilidade de suportar esses caracteres.
Mas mesmo que a máquina do leitor use apenas uma fonte diferente, isso pode tornar o texto consideravelmente menos legível. Para um primeiro exemplo , isso é renderizado com duas fontes diferentes:
Serif livre renderiza o texto como você provavelmente gostaria que fosse renderizado ao usar caracteres especiais para simular texto, ou seja, simulando a escrita manual com um traço contínuo. No entanto, esses caracteres são criados para serem usados como símbolos matemáticos, conectando o que não faz sentido. Portanto, a renderização do STIX , projetada especificamente para fins matemáticos, está mais alinhada com a maneira como esses caracteres devem ser usados.
Em um segundo exemplo , suponha que você ou o leitor coloque itálico em "por favor" por algum motivo. Com uma boa fonte, você terá 4 :
A razão para isso é que as letras maiúsculas foram (parcialmente) simuladas com letras cirílicas, e o itálico cirílico às vezes parece muito diferente de suas contrapartes verticais . Então, novamente, este é o comportamento adequado.
Pesquisabilidade
Como primeiro exemplo, considere o que você gostaria de fazer uma pesquisa razoável com o caractere 𝒲 (script matemático W ). Suponha que a pesquisa tenha dois modos, o modo padrão e o modo exato (geralmente chamado com distinção entre maiúsculas e minúsculas ). Esse caractere deve ser:
encontrado ao pesquisar w ou W no modo padrão - para aqueles que não querem se incomodar em inserir ou copiar e colar o caractere especial no campo de pesquisa;
encontrado ao pesquisar 𝒲 no modo exato - para quem deseja pesquisar onde a variável correspondente é mencionada em um documento matemático³;
não encontrado ao pesquisar 𝓌, w ou W no modo exato, devido à quebra de uma pesquisa semelhante à acima.
No entanto, se você usar esse caractere para simular texto comum, ele deverá ser encontrado ao pesquisar W ou 𝒲 no modo exato, que está em conflito com o acima.
Como segundo exemplo, considere que caracteres cirílicos nunca devem ser encontrados ao pesquisar caracteres latinos e vice-versa, pois são coisas completamente diferentes. No entanto, se você usar caracteres cirílicos para simular letras maiúsculas em latim, será necessário que isso aconteça, se você não quiser que a capacidade de pesquisa seja interrompida. Isso levaria as pessoas a encontrarem muitas coisas inúteis se procurarem uma palavra rara do alfabeto latino que, por acaso, corresponde às letras minúsculas falsas de alguma palavra popular do alfabeto cirílico (e vice-versa).
Uma opção de pesquisa exata não pode resolver esse problema, pois ela é reservada para outros fins nesses alfabetos.
Em geral , é impossível criar uma pesquisa (sem uma quantidade insana de opções) que não seja interrompida usando caracteres especiais para simular texto em estilo latino.
1 Você conhece o XKCD sobre a inevitável falha na unificação de padrões ? Bem, o Unicode teve sucesso.
2 ou qualquer que seja o operador vazio da convenção pertinente.
3 Estou ciente de que muito poucos textos matemáticos hoje em dia suportam essa codificação ou algo compatível com ela, mas o ponto é que algum dia eles esperam. O texto que abusar de Unicode ainda pode estar por aí e ser lido.
4 A menos que você esteja localizando para macedônio ou sérvio, no qual obterá resultados diferentes, mas ainda indesejáveis.