Perguntas com a marcação «character-encoding»

A codificação de caracteres refere-se à maneira como os caracteres são representados como uma série de bytes. A codificação de caracteres para a Web é definida no padrão de codificação.

7
Como adivinhar com segurança a codificação entre MacRoman, CP1252, Latin1, UTF-8 e ASCII
No trabalho, parece que nenhuma semana passa sem algum conluio, calamidade ou catástrofe relacionada à codificação. O problema geralmente deriva de programadores que pensam que podem processar de forma confiável um arquivo de “texto” sem especificar a codificação. Mas você não pode. Portanto, decidiu-se, doravante, proibir que os arquivos tenham …




2
Quantos bits ou bytes existem em um personagem? [fechadas]
É difícil dizer o que está sendo perguntado aqui. Esta questão é ambígua, vaga, incompleta, excessivamente ampla ou retórica e não pode ser respondida de forma razoável em sua forma atual. Para obter ajuda no esclarecimento dessa questão para que ela possa ser reaberta, visite a Central de Ajuda . …

9
Ler um arquivo UTF8 CSV com Python
Estou tentando ler um arquivo CSV com caracteres acentuados com Python (somente caracteres franceses e / ou espanhóis). Com base na documentação do Python 2.5 para o csvreader ( http://docs.python.org/library/csv.html ), criei o seguinte código para ler o arquivo CSV, já que o csvreader oferece suporte apenas para ASCII. def …

3
JsonParseException: caractere ilegal sem aspas ((CTRL-CHAR, código 10)
Estou tentando usar org.apache.httpcomponentspara consumir uma API Rest, que postará dados no formato JSON na API. Eu recebo esta exceção: Causado por: com.fasterxml.jackson.core.JsonParseException: Caractere ilegal não cotado ((CTRL-CHAR, código 10)): deve ser escapado usando barra invertida para ser incluído na string. O motivo é porque ctrl-charestá incluído na string JSON. …

10
Charset com tudo incluído para evitar “java.nio.charset.MalformedInputException: Input length = 1”?
Estou criando um programa simples de contagem de palavras em Java que lê os arquivos baseados em texto de um diretório. No entanto, continuo recebendo o erro: java.nio.charset.MalformedInputException: Input length = 1 desta linha de código: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Sei que provavelmente entendi isso porque usei um Charsetque não …

6
Como encontrar o Charset / codificação padrão em Java?
A resposta óbvia é usar, Charset.defaultCharset()mas descobrimos recentemente que essa pode não ser a resposta certa. Disseram-me que o resultado é diferente do conjunto de caracteres padrão real usado pelas classes java.io em várias ocasiões. Parece que o Java mantém 2 conjuntos de charset padrão. Alguém tem alguma ideia sobre …



5
Python: convertendo de ISO-8859-1 / latin1 para UTF-8
Eu tenho esta string que foi decodificada de Quoted-printable para ISO-8859-1 com o módulo de e-mail. Isso me dá strings como "\ xC4pple" que corresponderia a "Äpple" (Apple em sueco). No entanto, não consigo converter essas strings em UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.