Onde posso baixar o banco de dados do dicionário de inglês em formato de texto? [fechadas]


127

Preciso ler o arquivo de texto em busca de uma palavra e retornar seu significado. Qualquer outro formato de arquivo também funcionará.


Eu escrevi um rastreador da Web para todos os famosos dicionários on-line (Oxford, Longman, Cambridge, Webster e Collins) que você pode usar para criar seu conjunto de dados. github.com/kiasar/Dictionary_crawler
Peyman

Respostas:


62

O Projeto Gutenberg hospeda o Dicionário de Inglês Unabridged do Webster, além de muitas outras obras literárias de domínio público. Na verdade, parece que eles têm várias versões do dicionário hospedadas com direitos autorais de anos diferentes. O que eu vinculei tem um copyright de 2009. Você pode dar uma olhada no site e investigar as diferentes versões do dicionário Webster.


1
Transcrição limpa de 2009 da versão de 1913, aparentemente o OCR não estava completamente limpo. Há um total de 15 versões no site.
DragonLord 11/06/16

57

user1247808 possui um bom link com: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Se isso não for suficiente para você:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (URL atualizado da sugestão de Michael Kropat)

Embora esse nome de arquivo seja alterado, você encontrará o mais recente ... que acaba sendo um arquivo de texto grande (muito grande).

http://dumps.wikimedia.org/enwiktionary/


obrigado .. por este link
AndyBoy 14/01

Você sempre pode baixar o wikcionário mais recente em dumps.wikimedia.org/enwiktionary/latest/…
Michael Kropat 3/16/16

androidtech / wordnet20 está no formato SQL e não no txt.
Dragonlord

1
Observação: a sintaxe no wordnet20 tem um TYPE = * obsoleto no arquivo .sql. Corra sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlpara substituir a sintaxe obsoleta antes de executá-lo contra uma versão 5.0+ do MySQL
Serguei Fedorov

nenhum arquivo txt simples contendo todas as palavras em inglês?
Nadav B

27

Eu não sei se é tarde demais, mas eu pensei que iria ajudar alguém.

Eu queria muito o mesmo ... encontrei-o eventualmente.

Talvez não seja perfeito, mas para mim é adequado (para o meu pequeno aplicativo de dicionário).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Não é um arquivo de despejo, mas um arquivo de script .sql do MYSQL

As palavras estão na tabela WN_SYNSET e o glossário / significado na tabela WN_GLOSS


4
Em que licença está essa?
Cole Johnson

2
Eu não tenho certeza ainda, mas pelo androidtech.com/html/downloads.php existeHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista

7
Usuários do MySQL: as instruções create table usam a opção TYPE agora removida. Executar este no arquivo sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlpara começar a trabalhar na última MySQL
anthonygore

15

Verifique se esses recursos gratuitos atendem às suas necessidades -


8
O FOLDOC (Dicionário on-line gratuito de computação) parece ser apenas um dicionário de termos / nomes de computação. Pode ser útil para alguns, mas não é um dicionário de uso geral em que você possa procurar a maioria das palavras.
Lèse majesté

2
O link da página ObjectGraph também está inoperante. As versões oficiais para download estão localizadas aqui .
Lèse majesté 28/12/12

@ Lèsemajesté seu link também está morto agora
yukashima huksay
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.