Perguntas com a marcação «utf-8»

UTF-8 é uma codificação de caracteres que descreve cada ponto de código Unicode usando uma sequência de bytes de um a quatro bytes. É compatível com versões anteriores do ASCII, enquanto ainda suporta a representação de todos os pontos de código Unicode.


24
Detecte a codificação e crie tudo UTF-8
Estou lendo muitos textos de vários feeds RSS e inserindo-os no meu banco de dados. Obviamente, existem várias codificações de caracteres diferentes usadas nos feeds, por exemplo, UTF-8 e ISO 8859-1. Infelizmente, às vezes há problemas com a codificação dos textos. Exemplo: O "ß" em "Fußball" deve ficar assim no …

5
UTF-8: Geral? Bin? Unicode?
Estou tentando descobrir qual agrupamento devo usar para vários tipos de dados. 100% do conteúdo que armazenarei é enviado pelo usuário. Meu entendimento é que eu deveria usar o IC geral UTF-8 (sem distinção entre maiúsculas e minúsculas) em vez do binário UTF-8. No entanto, não consigo encontrar uma distinção …
279 mysql  utf-8  collation 




2
Decodificação de URL UTF-8 em Python
Passei muito tempo, tanto quanto eu sou novato em Python. Como eu poderia decodificar esse URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 para este em python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) está retornando algo muito feio. Ainda sem solução, qualquer ajuda é apreciada.

11
Byte UTF-8 [] para String
Vamos supor que eu apenas usei a BufferedInputStreampara ler os bytes de um arquivo de texto codificado em UTF-8 em uma matriz de bytes. Eu sei que posso usar a rotina a seguir para converter os bytes em uma cadeia de caracteres, mas existe uma maneira mais eficiente / inteligente …
243 java  utf-8 

17
“Valor incorreto de string” ao tentar inserir UTF-8 no MySQL via JDBC?
É assim que minha conexão é definida: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); E estou recebendo o seguinte erro ao tentar adicionar uma linha a uma tabela: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Estou inserindo milhares de registros e sempre recebo esse …
228 mysql  jdbc  utf-8  utf8mb4 

16
Eu realmente preciso codificar '&' como '& amp;'?
Estou usando um &símbolo ' ' com HTML5 e UTF-8 no meu site <title>. O Google mostra muito bem oe comercial em seus SERPs, assim como todos os navegadores em seus títulos. http://validator.w3.org está me dando o seguinte: & não iniciou uma referência de personagem. (e provavelmente deveria ter escapado …

4
Grava no arquivo UTF-8 em Python
Estou realmente confuso com o codecs.open function. Quando eu faço: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Isso me dá o erro UnicodeDecodeError: o codec 'ascii' não pode decodificar o byte 0xef na posição 0: ordinal fora do intervalo (128) Se eu fizer: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() Funciona …


12
O DOMDocument do PHP loadHTML não codifica UTF-8 corretamente
Estou tentando analisar um pouco de HTML usando DOMDocument, mas quando o faço, de repente perco minha codificação (pelo menos é assim que me parece). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } O resultado desse código …

9
Como converter uma string para utf-8 em Python
Eu tenho um navegador que envia caracteres utf-8 para o meu servidor Python, mas quando eu o recupero da string de consulta, a codificação que o Python retorna é ASCII. Como posso converter a string simples para utf-8? OBSERVAÇÃO: A string transmitida da Web já está codificada em UTF-8, só …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.