Estou escrevendo um programa que precisa de MUITAS palavras do idioma inglês. Estou tentando encontrar um arquivo de dicionário que tenha muitas palavras. Alguém sabe de uma boa fonte? Eu tentei muitas fontes, mas elas não parecem ter.
Estou escrevendo um programa que precisa de MUITAS palavras do idioma inglês. Estou tentando encontrar um arquivo de dicionário que tenha muitas palavras. Alguém sabe de uma boa fonte? Eu tentei muitas fontes, mas elas não parecem ter.
Respostas:
E /usr/share/dict/words
em qualquer sistema Unix? De quantas palavras estamos falando? Como OED-Unabridged?
cat /usr/share/dict/words > words.txt
todas as coisas !
sudo apt-get install wbritish
Para um arquivo .txt do dicionário de inglês, você pode usar o Dicionário personalizado .
Você também pode gerar um aspell de lista ou lista de palavras com configurações próprias.
Além disso, você pode dar uma olhada em http://wordlist.sourceforge.net/
Apenas palavras em inglês: http://www.math.sjsu.edu/~foster/dictionary.txt
Veja também:
95 (insane)
3 (seldom used)
Strip
fornece cerca de 675 mil palavras.
http://www.math.sjsu.edu/~foster/dictionary.txt
350.000 palavras
Muito tarde, mas pode ser útil para outros.
Há também o WordNet . Seu formato de arquivos de dados está bem documentado.
Usei-o para criar uma biblioteca de dicionário incorporável para desenvolvedores de iOS ( www.lexicontext.com ) e também em um dos meus aplicativos.
@ Pesquisadores do futuro: você pode usar o aspell para fazer as verificações do dicionário; ele possui ligações em ruby e python. Isso tornaria seu trabalho muito mais simples.