Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

4
Número de épocas na implementação do Gensim Word2Vec
Há um iterparâmetro na gensimimplementação do Word2Vec classe gensim.models.word2vec.Word2Vec (sentenças = Nenhuma, tamanho = 100, alfa = 0,025, janela = 5, min_count = 5, max_vocab_size = None, amostra = 0, semente = 1, trabalhadores = 1, trabalhadores = 1, min_alpha = 0,0001, sg = 1, hs = 1, negativo = …

3
Pandas Dataframe para DMatrix
Estou tentando executar o xgboost no scikit learn. E eu só uso o Pandas para carregar dados no dataframe. Como eu devo usar pandas df com xgboost. Estou confuso com a rotina do DMatrix necessária para executar o xgboost algo.

3
Como usar o LeakyRelu como função de ativação na sequência DNN em keras? Quando ele funciona melhor que o Relu?
Como você usa o LeakyRelu como uma função de ativação na sequência DNN em keras? Se eu quiser escrever algo parecido com: model = Sequential() model.add(Dense(90, activation='LeakyRelu')) Qual é a solução? Coloque LeakyRelu semelhante a Relu? A segunda pergunta é: qual é a melhor configuração geral para ajustar os parâmetros …


2
Por que os algoritmos genéticos não são usados ​​para otimizar redes neurais?
Pelo meu entendimento, os algoritmos genéticos são ferramentas poderosas para otimização multiobjetivo. Além disso, o treinamento de redes neurais (especialmente as profundas) é difícil e tem muitos problemas (funções de custo não convexas - mínimos locais, gradientes de fuga e explosão etc.). Também sou conceitualmente que treinar um NN com …



1
Quantos recursos para amostra usando florestas aleatórias
A página da Wikipedia que cita "Os elementos do aprendizado estatístico" diz: Normalmente, para um problema de classificação com os recursos , os recursos são usados ​​em cada divisão.ppp⌊ p-√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Entendo que esse é um palpite bastante bom e provavelmente foi confirmado por evidências empíricas, mas existem outras razões …

1
XGBRegressor vs. xgboost.train diferença de velocidade enorme?
Se eu treinar meu modelo usando o seguinte código: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) termina em cerca de 1 minuto. Se eu treinar meu modelo usando …



1
Mapa de calor em um mapa em Python
O Mode Analytics possui um bom recurso de mapa de calor ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Mas não é propício para comparar mapas (apenas um por relatório). O que eles permitem é que os dados sejam facilmente puxados para um notebook python empacotado. E qualquer imagem em python pode ser facilmente adicionada …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.