Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

1
Theano na pesquisa de aprendizagem profunda
Quão amplamente o Theano é usado na pesquisa de aprendizado profundo? O Theano é um bom começo para aprender a implementação de algoritmos de aprendizado de máquina? Aprender a implementação de algo como uma rede feed forward realmente ajudará? Os estudantes de pós-graduação implementam redes neurais ou outros algoritmos pelo …

4
Como aprender a detecção de email de spam?
Quero saber como é feito um detector de e-mail de spam. Não estou tentando criar um produto comercial, será um exercício de aprendizado sério para mim. Portanto, estou procurando recursos, como projetos existentes, código fonte, artigos, documentos, etc., que eu possa seguir. Quero aprender com exemplos, acho que não sou …

2
visualizar um gráfico de caixa horizontal em R
Eu tenho um conjunto de dados como este. Os dados foram coletados através de um questionário e eu vou fazer algumas análises exploratórias. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <- c(100,200,300,400,500 ) test<- as.data.frame (cbind(windows,sql,excel,salary),stringsAsFactors=TRUE) test[,"salary"] <- as.numeric(as.character(test[,"salary"] )) Eu tenho uma variável de resultado …

3
Algoritmo para segmentação de dados de sequência
Eu tenho uma grande sequência de vetores de comprimento N. Preciso de algum algoritmo de aprendizado não supervisionado para dividir esses vetores em segmentos M. Por exemplo: O K-means não é adequado, porque coloca elementos semelhantes de locais diferentes em um único cluster. Atualizar: Os dados reais são assim: Aqui, …

1
Chunking complexo com NLTK
Estou tentando descobrir como usar o chunker em cascata do NLTK conforme o Capítulo 7 do livro do NLTK . Infelizmente, estou tendo alguns problemas ao executar medidas de fragmentação não triviais. Vamos começar com esta frase: "adventure movies between 2000 and 2015 featuring performances by daniel craig" Consigo encontrar …
8 python  nlp  nltk 





3
Gráfico interativo ao registrar dados
Estou olhando para o gráfico e explorar interativamente dados medidos ao vivo / continuamente. Existem algumas opções por aí, sendo plot.ly a mais fácil de usar. O Plot.ly possui uma interface do usuário fantástica e fácil de usar (facilmente escalável, configurável, facilmente ajustável / cabível na tela), mas não pode …


2
Agrupamento de união em gráficos bipartidos?
Estou tentando descobrir uma solução boa (e rápida) para o seguinte problema: Eu tenho dois modelos com os quais estou trabalhando, vamos chamá-los de jogadores e equipes. Um jogador pode estar em várias equipes e uma equipe pode ter vários jogadores). Estou trabalhando na criação de um elemento de interface …
8 graphs 

1
Diferença entre tf-idf e tf com Random Forests
Estou trabalhando em um problema de classificação de texto usando a Floresta aleatória como classificadores e uma abordagem de palavras-chave. Estou usando a implementação básica do Random Forests (o presente no scikit), que cria uma condição binária em uma única variável em cada divisão. Diante disso, existe uma diferença entre …


3
Para que serve a coleta de dados do usuário, além de veicular anúncios?
Bem, este parece ser o local mais adequado para esta pergunta. Todo site coleta dados do usuário, alguns apenas para usabilidade e personalização, mas a maioria, como as redes sociais, rastreia todos os movimentos da Web, alguns aplicativos gratuitos do telefone digitalizam mensagens de texto, histórico de chamadas e assim …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.