Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo


1
MinHashing vs SimHashing
Suponha que eu tenha cinco conjuntos que gostaria de agrupar. Entendo que a técnica SimHashing descrita aqui: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ poderia gerar três clusters ( {A}, {B,C,D}e {E}), por exemplo, se seus resultados fossem: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 Da mesma forma, …

5
Melhor biblioteca Julia para redes neurais
Eu tenho usado essa biblioteca para construção e análise básicas de redes neurais. No entanto, ele não tem suporte para a construção de redes neurais de várias camadas, etc. Então, eu gostaria de saber de alguma biblioteca agradável para fazer redes neurais avançadas e Deep Learning em Julia.

1
Hashing Trick - o que realmente acontece
Quando algoritmos ML, por exemplo, Vowpal Wabbit ou algumas das máquinas de fatoração que vencem competições de taxa de cliques ( Kaggle ), mencionam que os recursos são 'hash', o que isso realmente significa para o modelo? Vamos dizer que existe uma variável que representa o ID de um complemento …

7
O que é um 'nome antigo' de cientista de dados?
Termos como 'ciência de dados' e 'cientista de dados' são cada vez mais usados ​​atualmente. Muitas empresas estão contratando 'cientista de dados'. Mas não acho que seja um trabalho completamente novo. Os dados existiram no passado e alguém teve que lidar com dados. Eu acho que o termo 'cientista de …
12 bigdata 

2
Tarifas de companhias aéreas - Que análise deve ser usada para detectar comportamento competitivo de estabelecimento de preços e correlações de preços?
Quero investigar o comportamento de estabelecimento de preços das companhias aéreas - especificamente como as empresas reagem aos preços dos concorrentes. Como eu diria, meu conhecimento sobre análises mais complexas é bastante limitado. Eu fiz principalmente todos os métodos básicos para reunir uma visão geral dos dados. Isso inclui gráficos …


2
Dados de sentimento para Emoji
Para experimentar, gostaríamos de usar o Emoji incorporado em muitos Tweets como dados básicos de treinamento / verdade para uma análise quantitativa simples de senações. Os tweets geralmente não são estruturados para que a PNL funcione bem. De qualquer forma, existem 722 Emoji no Unicode 6.0 e provavelmente outros 250 …




2
Algoritmo de correspondência de preferências
Há um projeto paralelo no qual estou trabalhando, onde preciso estruturar uma solução para o seguinte problema. Eu tenho dois grupos de pessoas (clientes). O grupo Apretende comprar e o grupo Bpretende vender um determinado produto X. O produto tem uma série de atributos x_i, e meu objetivo é facilitar …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.