Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

4
R: aprendizado de máquina na GPU
Existem pacotes de aprendizado de máquina para o R que podem usar a GPU para melhorar a velocidade do treinamento (algo como o theano do mundo python)? Vejo que existe um pacote chamado gputools que permite a execução de código na gpu, mas estou procurando uma biblioteca mais completa para …



4
Ferramentas de ciência de dados usando Scala
Eu sei que o Spark está totalmente integrado ao Scala. Seu caso de uso é especificamente para grandes conjuntos de dados. Quais outras ferramentas têm bom suporte ao Scala? O Scala é mais adequado para conjuntos de dados maiores? Ou também é adequado para conjuntos de dados menores?

4
Como especificar atributos importantes?
Suponha um conjunto de dados vagamente estruturados (por exemplo, tabelas da Web / dados abertos vinculados), compostos por várias fontes de dados. Não existe um esquema comum seguido pelos dados e cada fonte pode usar atributos de sinônimo para descrever os valores (por exemplo, "nacionalidade" vs "bornIn"). Meu objetivo é …




4
Semelhança entre duas palavras
Estou procurando uma biblioteca Python que me ajude a identificar a semelhança entre duas palavras ou frases. Farei a conversão de áudio em texto, o que resultará em um dicionário em inglês ou em palavras que não sejam do dicionário (este pode ser um nome de pessoa ou empresa). Depois …
15 nlp  nltk 






3
Computação paralela e distribuída
Qual é (são) as diferenças entre computação paralela e distribuída? Quando se trata de escalabilidade e eficiência, é muito comum ver soluções que lidam com cálculos em clusters de máquinas e, às vezes, é chamado de processamento paralelo ou processamento distribuído. De certa maneira, o cálculo parece sempre paralelo, pois …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.