Para o layout, temos nosso famoso texto "Lorem ipsum" para testar sua aparência.
O que estou procurando é um conjunto de arquivos contendo Texto codificado com várias codificações diferentes que posso usar em meus testes JUnit para testar alguns métodos que lidam com a codificação de caracteres ao ler arquivos de texto.
Exemplo:Ter um ISO 8859-1
arquivo de Windows-1252
teste codificado e um arquivo de teste codificado. O Windows-1252 deve acionar as diferenças na região 80 16 - 9F 16 . Em outras palavras, deve conter pelo menos um caractere desta região para distingui-lo do ISO 8859-1.
Talvez o melhor conjunto de arquivos de teste seja aquele em que o arquivo de teste para cada codificação contém todos os seus caracteres uma vez. Mas talvez eu não esteja ciente de sth - todos nós gostamos dessa coisa de codificação, certo? :-)
Existe esse conjunto de arquivos de teste para problemas de codificação de caracteres por aí?