Vi essa pergunta na proposta do site Typography e me incomodou por não saber a resposta. Eu sempre tratei 'glifo' e 'caráter' como intercambiáveis.
Depois de ler uma explicação na página Modelo de codificação de caracteres Unicode , meu entendimento é aproximadamente o seguinte:
- Os caracteres são definidos pelo seu significado na linguagem, glifos, pela aparência . Portanto, a ligadura para combinar esteticamente
fi
é um glifo, mas dois caracteres.
Então, minha crença é (por favor, corrija-me se estiver errado) que a diferença prática seria:
- Analisadores de texto que não estão interessados na estética do texto lerão glifos como seus respectivos caracteres. Tão:
- Se você copiar e colar texto contendo glifos em um editor de texto sem formatação, os glifos serão convertidos em seus respectivos caracteres (um
fi
glifo de ligadura se tornaráf
ei
) - Qualquer sistema automatizado bem elaborado com base na análise de texto (por exemplo, rastreadores de mecanismo de pesquisa, leitores de tela, corretores ortográficos) interpretaria os glifos como seus respectivos caracteres.
- Um caractere pode ter muitos glifos ou conjuntos de glifos. Quero dizer que um glifo pode ter apenas um caractere, mas isso claramente não está certo, pois há um exemplo no artigo vinculado de 3 glifos e conjuntos de glifos que parecem corresponder a um caractere e a um conjunto de caracteres. Não vejo bem como isso poderia funcionar: certamente isso significa que haverá inconsistência ou ambiguidade na maneira como esses glifos são interpretados, variando de acordo com o interpretador. (ou varia por idioma ou fonte?)
- Enquanto os navegadores de glifos (por exemplo, o do Illustrator) contêm o conjunto completo de fontes, os mapas de caracteres (por exemplo, o mapa de caracteres do Windows) contêm apenas caracteres, não glifos com vários caracteres, como ligaduras (algo que eu nunca havia notado antes)
- Se você copiar e colar texto contendo glifos em um editor de texto sem formatação, os glifos serão convertidos em seus respectivos caracteres (um
Sinto que estou quase lá, mas claramente entendi mal algo em algum lugar ao longo da linha: não apenas a coisa "Um glifo com vários caracteres", mas também, copiar e colar o comportamento com ligaduras não é exatamente o que eu esperava:
- Copie a ligadura
fi
do Illustrator para esta caixa de entrada: cola comofi
(dois caracteres) conforme o esperado. - Cole o código HTML para it (
fi
) - exibido como a ligadura quando não estiver em um bloco de código (fi - que nesta fonte não se parece muito com uma ligadura, mas você verá um se tentar selecionar apenas metade ) e o código quando em um bloco de código (fi
), conforme o esperado. - Copie e cole a ligadura renderizada sem bloco de código de volta na caixa de entrada: cola como o caractere da ligadura e renderiza como a ligadura, independentemente de estar ou não em um bloco de código (fi e
fi
). Da mesma forma, as palavras que contêm: ajuste incorreto (fit misfits
) cola como ajuste incorreto (fit misfits
). Talvez dependa se o local em que está sendo colado compreende a codificação usada?
Quão errado está minha compreensão disso? Alguém pode me corrigir: declarando uma definição clara da diferença entre glifos e caracteres (se o meu está errado ou pode ser melhorado) e dar exemplos mais claros / precisos do que o meu do que isso significa na prática ?