URL url= new URL("http://example.com/query?q=random word £500 bank $");
URI uri = new URI(url.getProtocol(), url.getUserInfo(), IDN.toASCII(url.getHost()), url.getPort(), url.getPath(), url.getQuery(), url.getRef());
String correctEncodedURL=uri.toASCIIString();
System.out.println(correctEncodedURL);
Impressões
http://example.com/query?q=random%20word%20%C2%A3500%20bank%20$
O que esta acontecendo aqui?
1. Divida o URL em partes estruturais. Usarjava.net.URL
para isso.
2) Codifique cada parte estrutural corretamente!
3. Use IDN.toASCII(putDomainNameHere)
para Punycode codificar o nome do host!
4. Use java.net.URI.toASCIIString()
para codificação percentual, unicode codificado por NFC - (melhor seria NFKC!). Para mais informações, consulte: Como codificar corretamente este URL
Em alguns casos, é aconselhável verificar se o URL já está codificado . Substitua também os espaços codificados '+' pelos espaços codificados '% 20'.
Aqui estão alguns exemplos que também funcionarão corretamente
{
"in" : "http://نامهای.com/",
"out" : "http://xn--mgba3gch31f.com/"
},{
"in" : "http://www.example.com/‥/foo",
"out" : "http://www.example.com/%E2%80%A5/foo"
},{
"in" : "http://search.barnesandnoble.com/booksearch/first book.pdf",
"out" : "http://search.barnesandnoble.com/booksearch/first%20book.pdf"
}, {
"in" : "http://example.com/query?q=random word £500 bank $",
"out" : "http://example.com/query?q=random%20word%20%C2%A3500%20bank%20$"
}
A solução passa em torno de 100 dos casos de teste fornecidos pelos testes da Web Plattform .