Perguntas com a marcação «unicode»

Unicode é um padrão para codificação, representação e manipulação de texto com a intenção de suportar todos os caracteres necessários para o texto escrito, incorporando todos os sistemas de escrita, símbolos técnicos e pontuação.






4
Por que esse código, escrito ao contrário, imprime "Hello World!"
Aqui está um código que eu encontrei na Internet: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Esse código é impresso Hello World!na tela; você pode vê-lo aqui . Eu posso ver claramente public static void mainescrito, mas é ao contrário. Como esse código funciona? Como isso compila? Edit: Eu …

9
UnicodeDecodeError, byte de continuação inválido
Por que o item abaixo está falhando? e por que é bem-sucedido com o codec "latin-1"? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") resulta em: Traceback (most recent call last): File "<stdin>", line …
257 python  unicode  decode 

7
Substitua caracteres não ASCII por um único espaço
Preciso substituir todos os caracteres não ASCII (\ x00- \ x7F) por um espaço. Estou surpreso que isso não seja fácil no Python, a menos que esteja faltando alguma coisa. A função a seguir simplesmente remove todos os caracteres não ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if …

13
Python: Removendo \ xa0 da string?
Atualmente, estou usando a Beautiful Soup para analisar um arquivo HTML e chamar get_text(), mas parece que estou ficando com muitos \ xa0 Unicode representando espaços. Existe uma maneira eficiente de remover todos eles no Python 2.7 e transformá-los em espaços? Eu acho que a pergunta mais generalizada seria, existe …
241 python  parsing  unicode 

12
Quantos bytes leva um caractere Unicode?
Estou um pouco confuso sobre codificações. Até onde eu sei, os caracteres ASCII antigos usavam um byte por caractere. Quantos bytes um caractere Unicode requer? Presumo que um caractere Unicode possa conter todos os caracteres possíveis de qualquer idioma - estou correto? Então, quantos bytes ele precisa por caractere? E …

5
Como posso alterar a codificação de um arquivo com o vim?
Estou acostumado a usar o vim para modificar as terminações de linha de um arquivo: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators É possível usar um processo semelhante para alterar a …
235 vim  unicode 

8
Escrever texto Unicode em um arquivo de texto?
Estou retirando dados de um documento do Google, processando-os e gravando-os em um arquivo (que eventualmente colarei em uma página do Wordpress). Possui alguns símbolos não ASCII. Como posso convertê-los com segurança em símbolos que podem ser usados ​​na fonte HTML? Atualmente, estou convertendo tudo para Unicode no caminho, juntando …

5
Qual é a diferença entre _tmain () e main () em C ++?
Se eu executar meu aplicativo C ++ com o seguinte método main (), tudo ficará bem: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) …
224 c++  unicode  arguments 


11
Regexes JavaScript + Unicode
Como posso usar expressões regulares compatíveis com Unicode em JavaScript? Por exemplo, deve haver algo parecido \wque possa corresponder a qualquer ponto de código na categoria Cartas ou Marcas (não apenas as ASCII), e esperamos ter filtros como [[P *]] para pontuação, etc.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.