Outro motivo para acompanhar o curto é que ele corresponde a outras instâncias em que você pode especificar um conjunto de caracteres na marcação. Por exemplo:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
A consistência ajuda a reduzir erros e tornar o código mais legível.
Observe que o atributo charset não diferencia maiúsculas de minúsculas. Você pode usar UTF-8 ou utf-8, no entanto, o UTF-8 é mais claro, mais legível e mais preciso.
Além disso, não há absolutamente nenhuma razão para usar outro valor que não seja UTF-8 no atributo meta charset ou no cabeçalho da página. UTF-8 é a codificação padrão para documentos da Web desde HTML4 em 1999 e a única maneira prática de criar páginas da Web modernas.
Além disso, você não deve usar entidades HTML no UTF-8. Caracteres como o símbolo de direitos autorais devem ser digitados diretamente. As únicas entidades que você deve usar são os 5 caracteres de marcação reservados: menor que, maior que, e comercial, prime, double prime. As entidades precisam de um analisador de HTML, que você nem sempre deseja usar daqui para frente; elas introduzem erros, tornam seu código menos legível, aumentam o tamanho do arquivo e, às vezes, decodificam incorretamente em vários navegadores, dependendo de quais entidades você usou. Aprenda a digitar / inserir direitos autorais, marca registrada, cotação aberta, cotação fechada, apóstrofo, traço, traço, marcador, euro e qualquer outro caractere que você encontrar no seu conteúdo e usar esses caracteres reais no seu código. O Mac possui um Visualizador de caracteres que você pode ativar na Preferência do sistema de teclado, e você pode encontrar e arrastar e soltar os caracteres necessários ou usar o Visualizador de Teclado correspondente para ver quais teclas digitar. Por exemplo, a marca registrada é a opção + 2. UTF-8 contém todos os caracteres e símbolos de todas as línguas humanas escritas. Portanto, não há desculpa para usar - em vez de um traço em. Não é uma má idéia aprender também as regras de pontuação e tipografia ... por exemplo, sabendo que um período está dentro de uma citação próxima, não fora.
Usar uma tag para algo como tipo de conteúdo e codificação é altamente irônico, pois sem saber essas coisas, você não poderia analisar o arquivo para obter o valor da metatag.
Não, isso não é verdade. O navegador começa a analisar o arquivo como a codificação padrão do navegador, UTF-8 ou ISO-8859-1. Como US-ASCII é um subconjunto de ISO-8859-1 e UTF-8, o navegador pode ler muito bem de qualquer maneira ... é o mesmo. Quando o navegador encontra a tag meta charset, se a codificação é diferente da que o navegador já está usando, o navegador recarrega a página na codificação especificada. É por isso que colocamos a tag meta charset no topo, logo após a tag head, antes de qualquer outra coisa, até o título. Dessa forma, você pode usar caracteres UTF-8 em seu título.
Você deve salvar seu (s) arquivo (s) na codificação UTF-8 sem BOM
Isso não é estritamente verdade. Se você tiver apenas caracteres US-ASCII em seu documento, poderá salvá-lo como US-ASCII e servi-lo como UTF-8, porque é um subconjunto. Mas se houver caracteres Unicode, você está correto, você deve Salvar como UTF-8 sem BOM.
Se você deseja um bom editor de texto que salve seus arquivos em UTF-8, recomendo o Notepad ++.
No Mac, use o Bare Bones TextWrangler (gratuito) da Mac App Store ou o Bare Bones BBEdit, que está na Mac App Store por US $ 39,99 ... muito barato para uma ferramenta tão boa. Nos dois aplicativos, há um menu na parte inferior da janela do documento em que você especifica a codificação do documento e pode escolher facilmente "UTF-8 no BOM". E é claro que você pode definir isso como padrão para novos documentos nas Preferências.
Mas se o seu servidor da Web exibir a codificação no cabeçalho HTTP, o que é recomendado, as duas [metatags] serão desnecessárias.
Isso está incorreto. Obviamente, você deve definir a codificação no cabeçalho HTTP, mas também no atributo meta charset, para que a página possa ser salva pelo usuário, fora do navegador para armazenamento local e, em seguida, aberta novamente mais tarde. Nesse caso, a única indicação da codificação que estará presente é o atributo meta charset. Você também deve definir uma tag de base pelo mesmo motivo ... no servidor, a tag de base é desnecessária, mas quando aberta do armazenamento local, a tag de base permite que a página funcione como se estivesse no servidor, com todos os ativos no local e assim por diante, sem links quebrados.
AddDefaultCharset UTF-8
Ou você pode simplesmente alterar a codificação de tipos de arquivos específicos, como:
AddType text/html;charset=utf-8 html
Uma dica para veicular arquivos UTF-8 e Latin-1 (ISO-8859-1) é atribuir aos arquivos UTF-8 uma extensão "text" e os arquivos Latin-1 "txt".
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Por fim, considere Salvar seus documentos com as terminações de linha Unix, não as DOS herdadas ou as finais de linha Mac (clássicas), que não ajudam e podem prejudicar, especialmente no final da linha, à medida que nos distanciamos cada vez mais desses sistemas legados. Um documento HTML com HTML5 válido, codificação UTF-8 e finais de linha Unix é um trabalho bem feito. Você pode compartilhar e editar e armazenar, ler e recuperar e confiar nesse documento em muitos contextos. É a lingua franca. É papel digital.