Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

1
Implementação do t-SNE Python: divergência Kullback-Leibler
O t-SNE, como em [1], trabalha reduzindo progressivamente a divergência de Kullback-Leibler (KL), até que uma determinada condição seja atendida. Os criadores do t-SNE sugerem usar a divergência de KL como critério de desempenho para as visualizações: você pode comparar as divergências de Kullback-Leibler relatadas pelo t-SNE. É perfeitamente adequado …


4
Trabalhando com Clusters HPC
Na minha universidade, temos um cluster de computação HPC. Eu uso o cluster para treinar classificadores e assim por diante. Portanto, geralmente, para enviar um trabalho para o cluster (por exemplo, script python scikit-learn), preciso escrever um script Bash que contenha (entre outros) um comando como qsub script.py. No entanto, …



3
Como processar consultas de linguagem natural?
Estou curioso para consultar a linguagem natural. Stanford possui o que parece ser um forte conjunto de software para processamento de linguagem natural . Também vi a biblioteca Apache OpenNLP e a arquitetura geral para engenharia de texto . Há uma quantidade incrível de usos para o processamento de linguagem …
11 nlp 



1
Parâmetro scikit-learn n_jobs sobre uso e memória da CPU
Na maioria dos estimadores no scikit-learn, há um n_jobsparâmetro em fit/ predictmethods para criar trabalhos paralelos usando joblib. Notei que configurá-lo para -1criar apenas 1 processo Python e maximizar os núcleos, fazendo com que o uso da CPU atinja 2500% no topo. Isso é bem diferente de configurá-lo para um …


3
O que é LSTM, BiLSTM e quando usá-los?
Eu sou muito novo no aprendizado profundo e estou particularmente interessado em saber o que são LSTM e BiLSTM e quando usá-los (principais áreas de aplicação). Por que o LSTM e o BILSTM são mais populares que o RNN? Podemos usar essas arquiteturas de aprendizado profundo em problemas não supervisionados?

2
Comportamento estranho com o otimizador Adam ao treinar por muito tempo
Estou tentando treinar um único perceptron (1000 unidades de entrada, 1 saída, sem camadas ocultas) em 64 pontos de dados gerados aleatoriamente. Estou usando o Pytorch usando o otimizador Adam: import torch from torch.autograd import Variable torch.manual_seed(545345) N, D_in, D_out = 64, 1000, 1 x = Variable(torch.randn(N, D_in)) y = …

4
Aprendizado de máquina vs aprendizado profundo
Estou um pouco confuso com a diferença entre os termos "Machine Learning" e "Deep Learning". Eu pesquisei no Google e li muitos artigos, mas ainda não está muito claro para mim. Uma definição conhecida de Machine Learning de Tom Mitchell é: Um programa de computador é dito para aprender com …

4
Medida de desempenho: por que é chamado de recall?
precisão é a fração de instâncias recuperadas relevantes, enquanto recall (também conhecido como sensibilidade) é a fração de instâncias relevantes recuperadas. Eu sei o significado delas, mas não sei por que isso se chama recall ? Eu não sou falante nativo de inglês. Eu sei que recordar significa recordar, então …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.