Ok, eu não sei se isso é uma questão de programação, mas certamente é técnico, então estou perguntando aqui. Eu estava trabalhando em algumas coisas de internacionalização no meu código PHP, e para garantir que o meu HTML gerado mostrasse o Unicode corretamente baseado na codificação e coisas que eu decidi adicionar algum texto em chinês para a minha página PHP, que ecoa no navegador para completar o meu caso de teste.
Então eu entrei no google e digitei "chinês", copiei o primeiro texto chinês que a pesquisa retornou (que era 汉语/漢語
). Eu então copiei para o Notepad++
meu editor e, para minha surpresa, apareci como caixas semelhantes [][]/[][]
. Então eu pensei que a codificação Notepad++
estava bagunçada e mudei a codificação para UTF-8
e UCS
, nem funcionou. Eu fiz isso fresco em um arquivo recém-codificado, ainda tenho as caixas. O mesmo conteúdo quando eu colo Google
e StackOverFlow
(como eu fiz nesta postagem) mostra chinês correto!
Eu até abri Windows Clipboard Viewer
e o conteúdo é representado na área de transferência como caixas! Eu tentei colá-lo Windows Explorer address bar
e usar para renomear um arquivo para, mas eu ainda recebo caixas. Mas aparece corretamente quando colado no meu Chrome Browser address bar
!
Isso é um problema do Windows? Desde que eu sou capaz de colá-lo corretamente em SO, os dados na memória devem ser codificados corretamente, certo? Mas se esse for o caso, por que aparece como caixas no Visualizador da Área de Transferência?
Estou confuso aqui ... Pelo jeito que estou usando Windows XP with SP3
.
(Estou fazendo esta pergunta aqui, mesmo que não seja programático, porque está me impedindo de executar meus casos de teste de programação ..)