Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo



5
O que são ferramentas úteis de anotação (se houver)
Estou procurando ferramentas que ajudem a mim e à minha equipe a anotar conjuntos de treinamento. Eu trabalho em um ambiente com grandes conjuntos de dados, alguns dos quais são un ou semi-estruturados. Em muitos casos, existem registros que ajudam a encontrar uma verdade fundamentada. Em muitos casos, porém, é …

2
Prever a duração da tarefa
Estou tentando criar um modelo de regressão que prevê a duração de uma tarefa. Os dados de treinamento que possuo consistem em aproximadamente 40 mil tarefas concluídas com estas variáveis: Quem executou a tarefa (~ 250 pessoas diferentes) Em que parte (subprojeto) do projeto a tarefa foi executada (~ 20 …



4
Como combinar PCA e MCA em dados mistos?
Suponha que eu tenha dados misturados e código (python) capaz de executar PCA (análise de componentes principais) em preditores contínuos e MCA (análise de correspondência múltipla) em preditores nominais. É possível combinar resultados do PCA e MCA em um?



1
O ModelCheckpoint do keras não está funcionando
Estou tentando treinar um modelo no keras e estou usando o ModelCheckpoint para salvar o melhor modelo de acordo com uma métrica de validação monitorada (no meu caso, o índice Jaccard ). Embora eu possa ver o modelo melhorando no tensorboard, quando tento carregar os pesos e avaliar o modelo, …
8 keras  convnet 

1
Categorização de abordagens para lidar com classes desequilibradas
Qual é a melhor maneira de categorizar as abordagens desenvolvidas para lidar com o problema de classe de desequilíbrio? Este artigo os categoriza em: Pré-processamento: inclui métodos de superamostragem, subamostragem e híbrido, Aprendizagem sensível ao custo: inclui métodos diretos e meta-aprendizagem, que este último divide em limiar e amostragem, Técnicas …



5
Tutoriais sobre modelos de tópicos e LDA
Gostaria de saber se vocês têm alguns bons tutoriais (rápidos e diretos) sobre modelos de tópicos e LDA, ensinando intuitivamente como definir alguns parâmetros, o que eles significam e, se possível, com alguns exemplos reais.

2
Por que a regressão de aumento de gradiente prevê valores negativos quando não há valores y negativos no meu conjunto de treinamento?
Como eu aumentar o número de árvores em scikit aprender 's GradientBoostingRegressor, eu recebo previsões mais negativas, mesmo que não existem valores negativos em meu treinamento ou testar set. Eu tenho cerca de 10 recursos, a maioria dos quais são binários. Alguns dos parâmetros que eu estava ajustando foram: o …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.