Perguntas com a marcação «unicode»

Unicode é um padrão para codificação, representação e manipulação de texto com a intenção de suportar todos os caracteres necessários para o texto escrito, incorporando todos os sistemas de escrita, símbolos técnicos e pontuação.

6
Problema de codificação do Java FileReader
Tentei usar o java.io.FileReader para ler alguns arquivos de texto e convertê-los em uma string, mas descobri que o resultado está codificado incorretamente e não é legível. Aqui está o meu ambiente: Windows 2003, codificação do sistema operacional: CP1252 Java 5.0 Meus arquivos são codificados em UTF-8 ou CP1252 e …
130 java  file  unicode  encoding 


7
O que é o UTF-8 normalizado?
O projeto ICU (que agora também possui uma biblioteca PHP ) contém as classes necessárias para ajudar a normalizar cadeias UTF-8 para facilitar a comparação de valores durante a pesquisa. No entanto, estou tentando descobrir o que isso significa para aplicativos. Por exemplo, em quais casos eu quero "Equivalência canônica" …

8
O que é o código de caractere HTML 8203?
O que o código de caractere (HTML) ​? Eu o encontrei em um dos meus scripts jQuery e me perguntei o que era .. Obrigado. Editar: Aqui está o script em que estava (foi adicionado ao final, encontrado no Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() …


3
Equivalentes Unicode para \ w e \ b em expressões regulares Java?
Muitas implementações modernas de regex interpretam a \wabreviação da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como \w+jogos de palavras como hello, élève, GOÄ_432ou gefräßig. Infelizmente, Java não. Em Java, \wé limitado a [A-Za-z0-9_]. Isso dificulta palavras correspondentes como as …






6
Como posso gerar UTF-8 do Perl?
Estou tentando escrever um script Perl usando o pragma "utf8" e estou obtendo resultados inesperados. Estou usando o Mac OS X 10.5 (Leopard) e estou editando com o TextMate. Todas as minhas configurações para meu editor e sistema operacional são padronizadas para gravar arquivos no formato utf-8. No entanto, ao …
110 perl  unicode  utf-8 




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.