Perguntas com a marcação «nlp»

O processamento de linguagem natural (PNL) é um subcampo da inteligência artificial que envolve a transformação ou extração de informações úteis de dados de linguagem natural. Os métodos incluem aprendizado de máquina e abordagens baseadas em regras.



10
PNL Java Stanford: parte dos rótulos de fala?
A PNL de Stanford, demonstrada aqui , fornece uma saída como esta: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. O que significam as tags Part of Speech? Não consigo encontrar uma lista oficial. É o próprio sistema de Stanford ou eles estão usando tags universais? (O que é JJ, por exemplo?) …

15
Detectando sílabas em uma palavra
Preciso encontrar uma maneira bastante eficiente de detectar sílabas em uma palavra. Por exemplo, Invisível -> in-vi-sib-le Existem algumas regras de silabificação que podem ser usadas: V CV VC CVC CCV CCCV CVCC * onde V é uma vogal e C é uma consoante. Por exemplo, Pronúncia (5 Pro-freira-cação; CV-CVC-CV-V-CVC) …



11
Como se livrar da pontuação usando o tokenizer NLTK?
Estou começando a usar o NLTK e não entendo como obter uma lista de palavras do texto. Se eu usar nltk.word_tokenize(), recebo uma lista de palavras e pontuação. Eu preciso apenas das palavras. Como posso me livrar da pontuação? Também word_tokenizenão funciona com várias frases: pontos são adicionados à última …
125 python  nlp  tokenize  nltk 


2
Java ou Python para processamento de linguagem natural [fechado]
Fechado . Esta pergunta é baseada em opinião . Atualmente não está aceitando respostas. Quer melhorar esta questão? Atualize a pergunta para que possa ser respondida com fatos e citações editando este post . Fechado há 6 anos . Melhore esta questão Gostaria de saber qual linguagem de programação é …
112 java  python  nlp 

21
Como faço palavra Stemming ou Lemmatization?
Eu tentei PorterStemmer e Snowball, mas ambos não funcionam em todas as palavras, perdendo algumas muito comuns. Minhas palavras de teste são: " gatos administrando comunidades de cactos cactos cactos ", e ambas acertam menos da metade. Veja também: Algoritmo de derivação que produz palavras reais Stemming - exemplos de …


3
Como treinar o Stanford Parser com Genia Corpus?
Tenho alguns problemas para criar um novo modelo para Stanford Parser. Também baixei a última versão de Stanford: http://nlp.stanford.edu/software/lex-parser.shtml E aqui, Genia Corpus em 2 formatos, xml e ptb (Penn Treebank). Standford Parser pode treinar com arquivos ptd; aí baixei Genia Corpus, porque quero trabalhar com texto biomédico: http://categorizer.tmit.bme.hu/~illes/genia_ptb/ (link …
93 java  nlp  stanford-nlp 




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.