Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo



1
Redes Neurais: Como preparar dados do mundo real para detectar eventos de baixa probabilidade?
Eu tenho um conjunto de dados do mundo real de tomadores de crédito (50.000 registros). O conjunto contém categorias como Casado, Solteiro, Divorciado, etc., além de dados contínuos, como Renda, Idade, etc. Alguns registros estão incompletos ou contêm discrepâncias. A variável dependente é Padrão / Bom (0,1). Estamos tentando treinar …

3
Análise de sentimentos do Twitter: Detectando tweets neutros, apesar do treinamento apenas nas classes positivas e negativas
Eu sou um novato quando se trata de aprendizado de máquina. Estou tentando obter experiência prática analisando diferentes algoritmos de aprendizado supervisionado usando a biblioteca scikit-learn de python. Estou usando o conjunto de dados sentiment140 de 1,6 milhão de tweets para análise de sentimentos usando vários desses algoritmos. Não sei …

1
O que é um "mapeamento residual"?
Um artigo recente de He et al. ( Deep Residual Learning for Image Recognition , Microsoft Research, 2015) afirma que eles usam até 4096 camadas (não neurônios!). Estou tentando entender o papel, mas tropeço na palavra "residual". Alguém poderia me dar uma explicação / definição o que significa residual neste …

2
Treinamento de redes profundas em um laptop comum
Seria possível para um amador que está interessado em obter alguma experiência "prática" ao projetar e treinar redes neurais profundas, usar um laptop comum para esse fim (sem GPU) ou é impossível obter bons resultados em tempo razoável sem um computador / cluster / GPU poderoso? Para ser mais específico, …


2
Como interpretar uma árvore de decisão corretamente?
Estou tentando descobrir se estou interpretando corretamente uma árvore de decisão encontrada online. A variável dependente dessa árvore de decisão é a Classificação de crédito, que possui duas classes, Ruim ou Bom. A raiz desta árvore contém todas as 2464 observações neste conjunto de dados. O atributo mais influente para …


1
Onde exatamente
Entendi que os SVMs são classificadores lineares binários (sem o truque do kernel). Eles possuem dados de treinamento onde é um vetor e é a classe. Por serem binários, classificadores lineares, a tarefa é encontrar um hiperplano que separa os pontos de dados com o rótulo dos pontos de dados …

2
SPARK Mllib: Regressão logística multiclasse, como obter as probabilidades de todas as classes e não da primeira?
Estou usando LogisticRegressionWithLBFGSpara treinar um classificador de várias classes. Existe uma maneira de obter a probabilidade de todas as classes (não apenas a principal classe candidata) quando eu testar o modelo em novas amostras não vistas? PS: Não sou necessariamente obrigado a usar o classificador LBFGS, mas gostaria de usar …




5
Existe uma diferença entre "classificação" e "rotulagem"?
Até recentemente, eu pensava que "rotular" e "classificação" são sinônimos. Mas quando iniciei outra pergunta sobre terminologia em visão computacional , pensei: existe uma diferença entre "rotular" e "classificação"? Eu pensei que a "classe" é o conceito que você deseja detectar e "rotular" é o que você atribui aos dados. …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.