A Microsoft não facilita as coisas para você. O arquivo NLS mencionado na pergunta contém as informações de localidade, mas está em HEX. Mesmo com um editor hexadecimal, o conteúdo está longe de ser legível por humanos. Decidi adotar uma estratégia alternativa, inspirada na resposta da r0ca.
Há uma lista mais precisa de códigos de idioma disponíveis publicados pela Microsoft . Infelizmente, mesmo esta lista não está certa. (Instalei todos os locais disponíveis e tenho o norte do país, que não está na lista da Microsoft, mas não o espanhol tradicional, o espanhol moderno ou o macedônio. O ucraniano está na lista duas vezes.)
Os nomes também não estão certos na lista da Microsoft.
Em geral, os nomes devem ter o formato "Idioma" ou "Nome do país do idioma", por exemplo, "Inglês" ou "Inglês do Reino Unido"
Isso significa que os sublinhados após o primeiro devem ser substituídos por espaços e os nomes das pessoas precisam ser substituídos pelos nomes dos países, por exemplo, "Malay_Brunei_Darussalam" se torna "Malay_Brunei Darussalam" "Dutch_Belgian" torna-se "Dutch_Belgium"
Existem muitas outras esquisitices. Latim, cirílico e algumas outras palavras precisam ser colocadas entre colchetes, por exemplo, "Sérvio_Cirílico_Bósnia_Herzegovina" se torna "Sérvio (Cirílico) _Bósnia e Herzegovina"
Da mesma forma, "Sami_Inari" se torna "Sami (Inari) _Finland"
Existem muitos outros exemplos de adivinhar nomes de países apropriados "English_Filipines" se torna "English_Republic of the Philippines"
Eu descobri a maioria dessas exceções alterando meu código de idioma do Windows no painel de controle, depois carregando R e digitando
Sys.getlocale()
Infelizmente, esse método atualmente não funciona com as localidades indianas (mais algumas outras). Veja o relatório de erros aqui .