Perguntas com a marcação «scikit-learn»

O Scikit-learn é um módulo Python que compreende uma ferramenta simples e eficiente para aprendizado de máquina, mineração de dados e análise de dados. Ele é construído em NumPy, SciPy e matplotlib. É distribuído sob a licença BSD de 3 cláusulas.

2
Qual é o método mais eficiente para otimização de hiperparâmetros no scikit-learn?
Uma visão geral do processo de otimização de hiperparâmetros no scikit-learn está aqui . A pesquisa exaustiva na grade encontrará o conjunto ideal de hiperparâmetros para um modelo. A desvantagem é que a busca exaustiva na grade é lenta. A pesquisa aleatória é mais rápida que a pesquisa em grade, …

2
Max_depth no scikit é equivalente a poda em árvores de decisão?
Eu estava analisando o classificador criado usando uma árvore de decisão. Há um parâmetro de ajuste chamado max_depth na árvore de decisão do scikit . Isso é equivalente a podar uma árvore de decisão? Caso contrário, como podar uma árvore de decisão usando o scikit? dt_ap = tree.DecisionTreeClassifier(random_state=1, max_depth=13) boosted_dt …

3
Relação entre convolução em matemática e CNN
Li a explicação da convolução e a compreendi até certo ponto. Alguém pode me ajudar a entender como essa operação se relaciona à convolução nas redes neurais convolucionais? O filtro é uma função gque aplica peso?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3


1
Dados desequilibrados, causando má classificação no conjunto de dados de várias classes
Estou trabalhando na classificação de texto, onde tenho 39 categorias / classes e 8,5 milhões de registros. (No futuro, dados e categorias aumentarão). Estrutura ou formato dos meus dados é o seguinte. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 …





1
A confiança do rótulo de treinamento pode ser usada para melhorar a precisão da previsão?
Eu tenho dados de treinamento rotulados com valores binários. Eu também coletei a confiança de cada um desses rótulos, ou seja, 0,8 de confiança significaria que 80% das etiquetadoras humanas concordam com esse rótulo. É possível usar esses dados de confiança para melhorar a precisão do meu classificador? O seguinte …

2
Como treinar o modelo para prever eventos 30 minutos antes, a partir de séries temporais multidimensionais
Especialistas da minha área são capazes de prever a probabilidade de um evento (pico binário em amarelo) 30 minutos antes da ocorrência . A frequência aqui é de 1 segundo; essa visão representa algumas horas de dados; circulei em preto onde deveria estar o padrão "malicioso" . Existem interações entre …


2
Por que a regressão de aumento de gradiente prevê valores negativos quando não há valores y negativos no meu conjunto de treinamento?
Como eu aumentar o número de árvores em scikit aprender 's GradientBoostingRegressor, eu recebo previsões mais negativas, mesmo que não existem valores negativos em meu treinamento ou testar set. Eu tenho cerca de 10 recursos, a maioria dos quais são binários. Alguns dos parâmetros que eu estava ajustando foram: o …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.