Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

4
Pandas: como criar colunas de vários níveis
Eu tenho um DataFrame de pandas que possui as seguintes colunas: n_0 n_1 p_0 p_1 e_0 e_1 Eu quero transformá-lo para ter colunas e sub-colunas: 0 n p e 1 n p e Eu procurei na documentação e estou completamente perdido em como implementar isso. Alguém tem alguma sugestão?
8 pandas 

3
Bons livros para o Hadoop, Spark e Spark Streaming [fechado]
Fechado . Esta questão é baseada em opiniões . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela possa ser respondida com fatos e citações editando esta postagem . Fechado há 5 anos . Alguém pode sugerir bons livros para aprender hadoop e …


4
Semelhança no cargo
Estou tentando definir uma métrica entre os cargos no campo de TI. Para isso, preciso de alguma métrica entre as palavras dos cargos que não aparecem juntas no mesmo cargo, por exemplo, métrica entre as palavras sênior, primário, líder, chefe, vice-presidente, diretor, coisas, diretor, chefe, ou as palavras analista, especialista, …

2
Filtrando spam a partir de dados recuperados
Certa vez, ouvi dizer que filtrar spam usando listas negras não é uma boa abordagem, pois algum usuário que está procurando entradas no seu conjunto de dados pode estar procurando informações específicas das fontes bloqueadas. Também seria um fardo validar continuamente o estado atual de cada remetente de spam bloqueado, …










2
Identificando "Clusters" ou "Grupos" em uma Matriz
Eu tenho uma matriz que é preenchida com elementos discretos e preciso agrupá-los (usando R) em grupos intactos. Então, por exemplo, considere esta matriz: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Haveria dois clusters separados para A, …
7 r  clustering 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.