Perguntas com a marcação «unicode»

Unicode é um padrão para codificação, representação e manipulação de texto com a intenção de suportar todos os caracteres necessários para o texto escrito, incorporando todos os sistemas de escrita, símbolos técnicos e pontuação.





12
UTF-8, UTF-16 e UTF-32
Quais são as diferenças entre UTF-8, UTF-16 e UTF-32? Entendo que todos eles armazenam Unicode e que cada um usa um número diferente de bytes para representar um caractere. Existe uma vantagem em escolher um sobre o outro?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Salvando textos utf-8 no json.dumps como UTF8, não como \ u sequência de escape
Código de amostra: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" O problema: não é legível por humanos. Meus usuários (inteligentes) desejam verificar ou editar arquivos de texto com despejos JSON (e prefiro não usar XML). Existe uma maneira de serializar objetos em cadeias UTF-8 …
474 python  json  unicode  utf-8  escaping 

30
Melhor maneira de reverter uma string
Eu apenas tive que escrever uma função de reversão de string em C # 2.0 (ou seja, LINQ não disponível) e surgiu com isso: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse …

18
UnicodeDecodeError ao ler o arquivo CSV no Pandas com Python
Estou executando um programa que está processando 30.000 arquivos semelhantes. Um número aleatório deles está parando e produzindo esse erro ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …


9
O que é Unicode, UTF-8, UTF-16?
Qual é a base do Unicode e por que a necessidade de UTF-8 ou UTF-16? Eu pesquisei isso no Google e procurei aqui também, mas não está claro para mim. No VSS, ao fazer uma comparação de arquivos, às vezes há uma mensagem dizendo que os dois arquivos têm UTFs …

5
Por que 2 + 40 é igual a 42?
Fiquei perplexo quando um colega me mostrou essa linha de JavaScript alertando 42. alert(2+ 40); Executar snippet de códigoOcultar resultadosExpandir snippet Acontece rapidamente que o que parece ser um sinal de menos é realmente um caractere Unicode arcano com semântica claramente diferente. Isso me deixou pensando por que esse caractere …

11
Como faço para grep para todos os caracteres não ASCII?
Eu tenho vários arquivos XML muito grandes e estou tentando encontrar as linhas que contêm caracteres não ASCII. Eu tentei o seguinte: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Mas isso retorna todas as linhas do arquivo, independentemente de a linha conter um caractere no intervalo especificado. Tenho a sintaxe errada ou estou …
359 regex  unix  unicode  grep 


6
Como encontrar o comprimento de uma string em R
Como encontrar o comprimento de uma string (número de caracteres em uma string) sem dividi-lo em R? Eu sei como encontrar o comprimento de uma lista, mas não de uma string. E as strings Unicode? Como encontro o comprimento (em bytes) e o número de caracteres (runas, símbolos) em uma …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.