Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

2
Teste de software para ciência de dados em R
Costumo usar Nose, Tox ou Unittest ao testar meu código python, especialmente quando ele precisa ser integrado a outros módulos ou outras partes do código. No entanto, agora que me vi usando R mais que python para modelagem e desenvolvimento de ML. Percebi que realmente não testei meu código R …


1
Problema de classificação de texto: Word2Vec / NN é a melhor abordagem?
Estou procurando projetar um sistema que, com um parágrafo de texto, possa categorizá-lo e identificar o contexto: É treinado com parágrafos de texto gerados pelo usuário (como comentários / perguntas / respostas) Cada item do conjunto de treinamento será marcado com. Assim, por exemplo ("categoria 1", "parágrafo de texto") Haverá …


5
LSTM ou outro pacote RNN para R
Eu vi alguns resultados impressionantes dos modelos LSTM produzindo textos como Shakespeare. Eu queria saber se existe um pacote LSTM para R. Eu pesquisei por ele, mas só encontrei pacotes para Python e Julia. (talvez haja algum problema de desempenho que explique por que esses programas são mais preferíveis ao …
10 r  neural-network  rnn 

1
Transformando AutoEncoders
Acabei de ler o artigo de Geoff Hinton sobre a transformação de autoencodificadores Hinton, Krizhevsky e Wang: transformando codificadores automáticos . Em Redes Neurais Artificiais e Machine Learning, 2011. e gostaria muito de brincar com algo assim. Mas, depois de ler, não consegui obter detalhes suficientes do artigo sobre como …

2
Aprendizado de Reforço Cooperativo
Eu já tenho uma implementação para um único agente que trabalha em um problema dinâmico de precificação com o objetivo de maximizar a receita. O problema com o qual estou trabalhando, no entanto, envolve vários produtos diferentes que são substitutos um do outro, portanto, o preço dinâmico de todos eles …




1
Spark, idealmente dividindo um único RDD em dois
Eu tenho um grande conjunto de dados que preciso dividir em grupos de acordo com parâmetros específicos. Quero que o trabalho seja processado da maneira mais eficiente possível. Eu posso imaginar duas maneiras de fazer isso Opção 1 - Criar mapa a partir do RDD original e filtrar def customMapper(record): …


4
Como raspar página imdb?
Estou tentando aprender a raspagem da Web usando Python sozinho como parte de um esforço para aprender a análise de dados. Estou tentando raspar a página da Web do imdb cujo URL é o seguinte: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012 Estou usando o módulo BeautifulSoup. A seguir está o código que estou usando: r …


2
Bibliotecas para aprendizado de máquina on-line
Estou procurando pacotes (em python, R ou em um pacote independente) para executar o aprendizado on-line para prever dados de estoque. Eu encontrei e li sobre o Vowpal Wabbit ( https://github.com/JohnLangford/vowpal_wabbit/wiki ), que parece ser bastante promissor, mas estou me perguntando se existem outros pacotes por aí. Desde já, obrigado.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.