Perguntas com a marcação «nlp»

O processamento de linguagem natural (PNL) é um campo da ciência da computação, inteligência artificial e linguística, relacionado às interações entre computadores e linguagens humanas (naturais). Como tal, a PNL está relacionada à área de interação humano-computador. Muitos desafios na PNL envolvem o entendimento da linguagem natural, isto é, permitindo que os computadores obtenham significado das informações humanas ou da linguagem natural, e outros envolvem a geração da linguagem natural.

1
Gere previsões ortogonais (não correlacionadas) para uma determinada variável
Eu tenho uma Xmatriz, uma yvariável e outra variável ORTHO_VAR. Preciso prever a yvariável usando X, no entanto, as previsões desse modelo precisam ser ortogonais e, ao ORTHO_VARmesmo tempo, estar o mais correlacionadas ypossível. Eu preferiria que as previsões fossem geradas com um método não paramétrico como, por exemplo, xgboost.XGBRegressormas …
8 correlation  machine-learning  dataset  logistic-regression  prediction  linear-regression  prediction  dummy-variables  neural-network  image-classification  python  k-nn  python  neural-network  neural-network  deep-learning  keras  tensorflow  image-classification  tensorflow  reinforcement-learning  policy-gradients  machine-learning  decision-trees  neural-network  overfitting  data-analysis  metric  python  scikit-learn  distance  scipy  machine-learning  python  scikit-learn  decision-trees  logistic-regression  keras  image-classification  implementation  machine-learning  python  scikit-learn  random-forest  decision-trees  machine-learning  feature-selection  feature-engineering  word2vec  word-embeddings  natural-language-process  scikit-learn  time-series  clustering  k-means  python  cross-validation  pyspark  statistics  cross-validation  multiclass-classification  evaluation  machine-learning  nlp  machine-translation  neural-network  deep-learning  keras  tensorflow  image-classification  machine-learning  python  similarity  distance  lstm  text  named-entity-recognition  machine-learning  keras  optimization  gan  learning-rate  neural-network  data-mining  dataset  databases  books  neural-network  rnn 

3
Correspondência difusa de nome e apelido
Eu tenho um conjunto de dados com a seguinte estrutura: full_name,nickname,match Christian Douglas,Chris,1, Jhon Stevens,Charlie,0, David Jr Simpson,Junior,1 Anastasia Williams,Stacie,1 Lara Williams,Ana,0 John Williams,Willy,1 onde cada linha do preditor é um nome completo do par, apelido e a variável de destino, corresponde, que é 1 quando o apelido corresponde à …

2
Como obter o número de sílabas em uma palavra?
Eu já passei por este post que usa nltk's cmudictpara contar o número de sílabas em uma palavra: from nltk.corpus import cmudict d = cmudict.dict() def nsyl(word): return [len(list(y for y in x if y[-1].isdigit())) for x in d[word.lower()]] No entanto, para palavras fora do dicionário do cmu, como nomes …
8 nlp 




1
Compreensão de bayes ingênuos: computando as probabilidades condicionais
Para uma tarefa de análise de sentimentos, suponha que tenhamos algumas classes representadas por características .ccciii Podemos representar a probabilidade condicional de cada classe como: que representa cada recurso e é a classe temos. , podemos representar Nossos antecedentes para cada classe são dados por: que:P(c|wi)=P(wi|c)⋅P(c)P(wi)P(c|wi)=P(wi|c)⋅P(c)P(wi)P(c | w_i) = \frac{P(w_i|c) …


3
Análise de sentimentos do Twitter: Detectando tweets neutros, apesar do treinamento apenas nas classes positivas e negativas
Eu sou um novato quando se trata de aprendizado de máquina. Estou tentando obter experiência prática analisando diferentes algoritmos de aprendizado supervisionado usando a biblioteca scikit-learn de python. Estou usando o conjunto de dados sentiment140 de 1,6 milhão de tweets para análise de sentimentos usando vários desses algoritmos. Não sei …



1
Lidando com diversos dados de texto
Atualmente, estou trabalhando com um conjunto de dados com uma ampla variedade de comprimentos de documentos - de uma única palavra a uma página inteira de texto. Além disso, a estrutura gramatical e o uso da pontuação variam muito de um documento para outro. O objetivo é classificar esses documentos …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.