Eu tenho um arquivo html com muito texto UTF-8 codificado em% em URLs.
Por exemplo, "% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B" significa "ресурсы" ("recursos" em russo).
A tarefa é substituir todas essas substrings por texto UTF-8 legível.
Para simplificar a tarefa, podemos considerar que não há outro %
uso de sinal no arquivo. Os dígitos das letras podem ser maiúsculas e minúsculas.
Eu suspeito que isso pode ser feito de forma elegante com sed
, perl
, awk
ou algo assim, mas não sei como.
Esse aplicativo da Web parece funcionar com o texto que você cola lá.