Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

2
Escalada de dados de forma ética e econômica
Poucas coisas na vida me dão prazer, como coletar dados estruturados e não estruturados da Internet e utilizá-los em meus modelos. Por exemplo, a Ciência Toolkit de dados (ou RDSTKpara programadores R) permite-me para puxar lotes de bons baseados em localização de dados usando IP de ou endereços de e …

8
O Python é adequado para big data
Eu li neste post. A linguagem R é adequada para Big Data que o big data constitui 5TBe, embora faça um bom trabalho em fornecer informações sobre a viabilidade de trabalhar com esse tipo de dados R, fornece muito pouca informação sobre Python. Fiquei me perguntando se Pythonpode trabalhar com …
13 bigdata  python 


2
Existe alguma API para rastrear resumo de papel?
Se eu tiver uma lista muito longa de nomes de artigos, como obter um resumo desses artigos na Internet ou em qualquer banco de dados? Os nomes dos artigos são como "Avaliação da utilidade na mineração da Web para o domínio da saúde pública". Alguém conhece alguma API que possa …








2
Como você aplica o SMOTE na classificação de texto?
Técnica de superamostragem de minoria sintética (SMOTE) é uma técnica de superamostragem usada em um problema de conjunto de dados desequilibrado. Até agora, tenho uma ideia de como aplicá-lo em dados estruturados genéricos. Mas é possível aplicá-lo no problema de classificação de texto? Qual parte dos dados você precisa exagerar? …

4
Uma alternativa de codificação quente para grandes valores categóricos?
Oi tenho dataframe com grandes valores categóricos acima de 1600 categorias existe alguma maneira de encontrar alternativas para que eu não tenha mais de 1600 colunas. Encontrei este link interessante abaixo http://amunategui.github.io/feature-hashing/#sourcecode Mas eles estão convertendo para classe / objeto que eu não quero. Quero minha saída final como um …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.