Perguntas com a marcação «character-encoding»

A codificação de caracteres refere-se à maneira como os caracteres são representados como uma série de bytes. A codificação de caracteres para a Web é definida no padrão de codificação.



8
Escrever texto Unicode em um arquivo de texto?
Estou retirando dados de um documento do Google, processando-os e gravando-os em um arquivo (que eventualmente colarei em uma página do Wordpress). Possui alguns símbolos não ASCII. Como posso convertê-los com segurança em símbolos que podem ser usados ​​na fonte HTML? Atualmente, estou convertendo tudo para Unicode no caminho, juntando …






16
Eu realmente preciso codificar '&' como '& amp;'?
Estou usando um &símbolo ' ' com HTML5 e UTF-8 no meu site <title>. O Google mostra muito bem oe comercial em seus SERPs, assim como todos os navegadores em seus títulos. http://validator.w3.org está me dando o seguinte: & não iniciou uma referência de personagem. (e provavelmente deveria ter escapado …

12
O DOMDocument do PHP loadHTML não codifica UTF-8 corretamente
Estou tentando analisar um pouco de HTML usando DOMDocument, mas quando o faço, de repente perco minha codificação (pelo menos é assim que me parece). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } O resultado desse código …


11
Converter Unicode em ASCII sem erros em Python
Meu código apenas raspa uma página da Web e depois a converte em Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Mas eu recebo um UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 …


11
Qual é a diferença entre codificação e charset?
Estou confuso sobre a codificação e o conjunto de caracteres de texto. Por muitas razões, tenho que aprender coisas que não são Unicode e não UTF8 no meu próximo trabalho. Eu encontro a palavra "charset" nos cabeçalhos de email, como em "ISO-2022-JP", mas não existe tal codificação nos editores de …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.