Em 2010, você serviria URLs contendo caracteres UTF-8 em um grande portal da web?
Os caracteres Unicode são proibidos de acordo com o RFC nos URLs (veja aqui ). Eles teriam que ser codificados em porcentagem para serem compatíveis com os padrões.
Meu ponto principal, no entanto, é veicular os caracteres não codificados com o único objetivo de ter URLs de boa aparência, portanto, a porcentagem de codificação está fora.
Todos os principais navegadores parecem analisar bem esses URLs, independentemente do que diz a RFC. Minha impressão geral, porém, é que fica muito instável ao sair do domínio dos navegadores da web:
- URLs sendo copiadas + coladas em arquivos de texto, e-mails e até sites com codificação diferente
- Bibliotecas do cliente HTTP
- Navegadores exóticos, leitores de RSS
Minha impressão está correta de que o problema é esperado aqui e, portanto, ainda não é uma solução prática se você estiver atendendo a um público não técnico e é importante que todos os seus links funcionem corretamente, mesmo que citados e transmitidos?
Existe alguma maneira mágica de exibir URLs de boa aparência em HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
que pode ser copiado + colado com os caracteres especiais intactos, mas funciona corretamente quando reutilizado em clientes mais antigos?