Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo


3
Correspondência difusa de nome e apelido
Eu tenho um conjunto de dados com a seguinte estrutura: full_name,nickname,match Christian Douglas,Chris,1, Jhon Stevens,Charlie,0, David Jr Simpson,Junior,1 Anastasia Williams,Stacie,1 Lara Williams,Ana,0 John Williams,Willy,1 onde cada linha do preditor é um nome completo do par, apelido e a variável de destino, corresponde, que é 1 quando o apelido corresponde à …


2
Existe algum consenso sobre a escolha de uma abordagem de ML apropriada?
Atualmente, estou estudando ciência de dados e aprendemos uma variedade estonteante de técnicas básicas de regressão / classificação (linear, logística, árvores, splines, RNA, SVM, MARS etc.), juntamente com uma variedade de ferramentas extras (bootstrapping, reforço, ensacamento, conjunto, cume / laço, CV, etc etc). Às vezes, as técnicas recebem contexto (por …









1
Como treinar dados por lote do disco?
Estou trabalhando em uma rede neural convolucional para classificação de imagens. O conjunto de dados de treinamento é muito grande para ser carregado na memória do meu computador (4 gb), além disso, também preciso tentar algum aprimoramento para equilibrar as classes. Eu estou usando keras. Eu olhei em muitos exemplos, …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.