Perguntas com a marcação «data-mining»

Uma atividade que procura padrões em conjuntos de dados grandes e complexos. Geralmente enfatiza técnicas algorítmicas, mas também pode envolver qualquer conjunto de habilidades, aplicativos ou metodologias relacionadas com esse objetivo.

2
Como construir um mecanismo de pesquisa textual?
Estou tendo uma string HTML e quero descobrir se uma palavra fornecida é relevante nessa string. A relevância pode ser medida com base na frequência do texto. Um exemplo para ilustrar meu problema: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check …

1
Gere previsões ortogonais (não correlacionadas) para uma determinada variável
Eu tenho uma Xmatriz, uma yvariável e outra variável ORTHO_VAR. Preciso prever a yvariável usando X, no entanto, as previsões desse modelo precisam ser ortogonais e, ao ORTHO_VARmesmo tempo, estar o mais correlacionadas ypossível. Eu preferiria que as previsões fossem geradas com um método não paramétrico como, por exemplo, xgboost.XGBRegressormas …
8 correlation  machine-learning  dataset  logistic-regression  prediction  linear-regression  prediction  dummy-variables  neural-network  image-classification  python  k-nn  python  neural-network  neural-network  deep-learning  keras  tensorflow  image-classification  tensorflow  reinforcement-learning  policy-gradients  machine-learning  decision-trees  neural-network  overfitting  data-analysis  metric  python  scikit-learn  distance  scipy  machine-learning  python  scikit-learn  decision-trees  logistic-regression  keras  image-classification  implementation  machine-learning  python  scikit-learn  random-forest  decision-trees  machine-learning  feature-selection  feature-engineering  word2vec  word-embeddings  natural-language-process  scikit-learn  time-series  clustering  k-means  python  cross-validation  pyspark  statistics  cross-validation  multiclass-classification  evaluation  machine-learning  nlp  machine-translation  neural-network  deep-learning  keras  tensorflow  image-classification  machine-learning  python  similarity  distance  lstm  text  named-entity-recognition  machine-learning  keras  optimization  gan  learning-rate  neural-network  data-mining  dataset  databases  books  neural-network  rnn 





1
Como o SQL Server Analysis Services se compara ao R?
Pode ser uma pergunta muito ampla com opiniões pesadas, mas estou realmente achando difícil buscar informações sobre a execução de vários algoritmos usando projetos de mineração de dados do SQL Server Analysis Service versus usando R. Isso ocorre principalmente porque todos os profissionais de ciência de dados com quem trabalho …

1
Como o classificador ingênuo de Bayes lida com os dados ausentes no treinamento?
Aparentemente, o Naive Bayes lida com os dados ausentes de maneira diferente, dependendo se eles existem em instâncias de treinamento ou teste / classificação. Ao classificar instâncias, o atributo com o valor ausente simplesmente não é incluído no cálculo de probabilidade ( http://www.inf.ed.ac.uk/teaching/courses/iaml/slides/naive-2x2.pdf ) No treinamento, "a instância [com os …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.