Existe uma maneira de determinar o conjunto de caracteres usado para um dado shapefile?
Existe uma maneira de determinar o conjunto de caracteres usado para um dado shapefile?
Respostas:
Tentativa e erro. Tente abrir o arquivo .dbf com o Ms Excel ou com o OpenOffice usando configurações diferentes até você acertar tudo.
Veja esta postagem para obter mais dicas: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Existem duas maneiras de os programas determinarem o conjunto de caracteres para um shapefile.
O file
utilitário é capaz de adivinhar a codificação de um arquivo de texto. Use ogr2ogr
para uma conversão que preserva a codificação original se não houver .cpg
arquivo :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Exemplo de saída:
file.csv: ISO-8859 text
Eu testei com duas das codificações mais frequentes, UTF-8 e latin1. Funciona imediatamente no Ubuntu, não tenho certeza sobre o OS X. Não conheço um file
utilitário no Windows.
NOTA : Assim que houver um .cpg
arquivo correspondente que indique a codificação, ogr2ogr
o honrará e a saída estará em UTF-8. Mas se a saída CSV parecer correta, você saberá que as informações no .cpg
arquivo são precisas.
Outra tabela para converter o 29º byte de * .dbf na página de códigos: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm