Perguntas com a marcação «unicode»

Unicode é um padrão para codificação, representação e manipulação de texto com a intenção de suportar todos os caracteres necessários para o texto escrito, incorporando todos os sistemas de escrita, símbolos técnicos e pontuação.


5
Dados de teste de exemplo UTF-8 realmente bons, ruins [fechado]
Fechadas. Esta pergunta não atende às diretrizes do Stack Overflow . Atualmente não está aceitando respostas. Quer melhorar esta questão? Atualize a pergunta para que esteja no tópico do Stack Overflow. Fechado há 3 anos . Melhore esta questão Portanto, temos a folha de dicas XSS para testar nossa filtragem …
88 unicode  utf-8 

8
Como posso substituir caracteres Unicode não imprimíveis em Java?
O seguinte substituirá os caracteres de controle ASCII (abreviação de [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); O seguinte substituirá todos os caracteres ASCII não imprimíveis (abreviação de [\p{Graph}\x20]), incluindo caracteres acentuados: my_string.replaceAll("[^\\p{Print}]", "?"); No entanto, nenhum dos dois funciona para strings Unicode. Alguém tem uma boa maneira de remover caracteres não imprimíveis de …
88 java  string  unicode 

12
O TCHAR ainda é relevante?
Eu sou novo na programação do Windows e depois de ler o livro Petzold, eu me pergunto: ainda é uma boa prática usar o TCHARtipo e a _T()função para declarar strings ou se eu deveria apenas usar as strings wchar_te L""no novo código? Visarei apenas o Windows 2000 e superior …
87 c++  c  windows  unicode  wchar-t 



6
Uso de 'use utf8;' me dá 'Wide character in print'
Se eu executar o seguinte programa Perl: perl -e 'use utf8; print "鸡\n";' Eu recebo este aviso: Wide character in print at -e line 1. Se eu executar este programa Perl: perl -e 'print "鸡\n";' Eu não recebo um aviso. Achei que use utf8era necessário usar caracteres UTF-8 em um …
86 perl  unicode  utf-8 

2
Regex: o que é InCombiningDiacriticalMarks?
O código a seguir é muito conhecido por converter caracteres acentuados em texto simples: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); Substituí meu método "feito à mão" por este, mas preciso entender a parte "regex" do replaceAll 1) O que é "InCombiningDiacriticalMarks"? 2) Onde está a documentação disso? (e similares?) Obrigado.
86 java  regex  unicode 

1
WebClient.DownloadString resulta em caracteres mutilados devido a problemas de codificação, mas o navegador está OK
O seguinte código: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); resulta em uma variável textque contém, entre muitas outras coisas, a string "$ κ $ -Espaço de Minkowski, campo escalar e a questão da invariância de Lorentz" No entanto, quando visito esse URL no Firefox, recebo $ κ $ -pace de Minkowski, …




3
Quais caracteres são agrupados com Array.from?
Eu tenho brincado com o JS e não consigo descobrir como o JS decide quais elementos adicionar ao array criado ao usar Array.from(). Por exemplo, o seguinte emoji 👍 tem um lengthde 2, pois é composto por dois pontos de código, mas Array.from()trata esses dois pontos de código como um, …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.