Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo


7
Raspagem na web do LinkedIn
Descobri recentemente um novo pacote R para conectar-se à API do LinkedIn. Infelizmente, a API do LinkedIn parece bastante limitada; por exemplo, você só pode obter dados básicos sobre empresas, e isso é desanexado dos dados de indivíduos. Gostaria de obter dados de todos os funcionários de uma determinada empresa, …

2
Rede neural para monitoramento de servidor
Estou olhando o pybrain para receber alarmes do monitor do servidor e determinar a causa raiz de um problema. Fico feliz em treiná-lo usando aprendizado supervisionado e selecionando os conjuntos de dados de treinamento. Os dados estão estruturados mais ou menos assim: Servidor Tipo A # 1 Tipo de alarme …




5
Como mesclar dados mensais, diários e semanais?
O Google Trends retorna dados semanais, portanto, preciso encontrar uma maneira de mesclá-los com meus dados diários / mensais. O que fiz até agora é dividir cada série em dados diários, por exemplo: a partir de: 2013-03-03 - 2013-03-09 37 para: 2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 …



4
Técnica de extração de recursos - Resumindo uma sequência de dados
Costumo criar um modelo (classificação ou regressão) em que tenho algumas variáveis ​​preditoras que são sequências e tenho tentado encontrar recomendações técnicas para resumi-las da melhor maneira possível para inclusão como preditores no modelo. Como exemplo concreto, digamos que um modelo esteja sendo construído para prever se um cliente deixará …


4
Algoritmo para gerar regras de classificação
Portanto, temos potencial para um aplicativo de aprendizado de máquina que se encaixe perfeitamente no domínio do problema tradicional resolvido pelos classificadores, ou seja, temos um conjunto de atributos que descrevem um item e um "bloco" no qual eles terminam. No entanto, em vez de criar modelos de probabilidades, como …

3
Os algoritmos de redução de mapa criados para o MongoDB podem ser portados para o Hadoop posteriormente?
Em nossa empresa, temos um banco de dados MongoDB contendo muitos dados não estruturados, nos quais precisamos executar algoritmos de redução de mapa para gerar relatórios e outras análises. Temos duas abordagens para selecionar para implementar as análises necessárias: Uma abordagem é extrair os dados do MongoDB para um cluster …


2
Abandono em quais camadas do LSTM?
Usando uma camada múltipla LSTMcom desistência, é recomendável colocar desistência em todas as camadas ocultas e nas camadas densas de saída? No artigo de Hinton (que propôs o Dropout), ele apenas colocou o Dropout nas camadas densas, mas isso ocorreu porque as camadas internas ocultas eram convolucionais. Obviamente, posso testar …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.