Ok, eu não sei se isso é uma questão de programação, mas certamente é técnico, então estou perguntando aqui. Eu estava trabalhando em algumas coisas de internacionalização no meu código PHP, e para garantir que o meu HTML gerado mostrasse o Unicode corretamente baseado na codificação e coisas que eu decidi adicionar algum texto em chinês para a minha página PHP, que ecoa no navegador para completar o meu caso de teste.
Então eu entrei no google e digitei "chinês", copiei o primeiro texto chinês que a pesquisa retornou (que era 汉语/漢語). Eu então copiei para o Notepad++meu editor e, para minha surpresa, apareci como caixas semelhantes [][]/[][]. Então eu pensei que a codificação Notepad++estava bagunçada e mudei a codificação para UTF-8e UCS, nem funcionou. Eu fiz isso fresco em um arquivo recém-codificado, ainda tenho as caixas. O mesmo conteúdo quando eu colo Googlee StackOverFlow(como eu fiz nesta postagem) mostra chinês correto!
Eu até abri Windows Clipboard Viewere o conteúdo é representado na área de transferência como caixas! Eu tentei colá-lo Windows Explorer address bare usar para renomear um arquivo para, mas eu ainda recebo caixas. Mas aparece corretamente quando colado no meu Chrome Browser address bar!
Isso é um problema do Windows? Desde que eu sou capaz de colá-lo corretamente em SO, os dados na memória devem ser codificados corretamente, certo? Mas se esse for o caso, por que aparece como caixas no Visualizador da Área de Transferência?
Estou confuso aqui ... Pelo jeito que estou usando Windows XP with SP3.
(Estou fazendo esta pergunta aqui, mesmo que não seja programático, porque está me impedindo de executar meus casos de teste de programação ..)