Perguntas com a marcação «machine-learning»

Os algoritmos de aprendizado de máquina constroem um modelo dos dados de treinamento. O termo "aprendizado de máquina" é vagamente definido; inclui o que também é chamado aprendizado estatístico, aprendizado reforçado, aprendizado não supervisionado etc. SEMPRE ADICIONE UM TAG MAIS ESPECÍFICO.


2
Medidas de importância variável em florestas aleatórias
Venho brincando com florestas aleatórias para regressão e estou tendo dificuldade em descobrir exatamente o que as duas medidas de importância significam e como elas devem ser interpretadas. A importance()função fornece dois valores para cada variável: %IncMSEe IncNodePurity. Existem interpretações simples para esses 2 valores? Em IncNodePurityparticular, isso é simplesmente …

7
Normalização e padronização de dados em redes neurais
Estou tentando prever o resultado de um sistema complexo usando redes neurais (RNAs). Os valores do resultado (dependentes) variam entre 0 e 10.000. As diferentes variáveis ​​de entrada têm intervalos diferentes. Todas as variáveis ​​têm distribuições aproximadamente normais. Considero diferentes opções para dimensionar os dados antes do treinamento. Uma opção …

3
Diferença entre floresta aleatória e árvores extremamente aleatórias
Entendi que Floresta Aleatória e Árvores Extremamente Aleatórias diferem no sentido de que as divisões das árvores na Floresta Aleatória são determinísticas, enquanto que são aleatórias no caso de Árvores Extremamente Aleatórias (para ser mais preciso, a próxima divisão é a melhor divisão entre divisões uniformes aleatórias nas variáveis ​​selecionadas …

5
LDA vs word2vec
Estou tentando entender qual é a semelhança entre Alocação de Dirichlet Latente e word2vec para calcular a similaridade de palavras. Pelo que entendi, o LDA mapeia palavras para um vetor de probabilidades de tópicos latentes , enquanto o word2vec as mapeia para um vetor de números reais (relacionado à decomposição …

6
Por que recebo uma árvore de decisão com 100% de precisão?
Estou obtendo uma precisão de 100% para minha árvore de decisão. O que estou fazendo errado? Este é o meu código: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import …

3
Diretriz para selecionar os hiperparâmetros no Deep Learning
Estou procurando um artigo que possa ajudar a fornecer diretrizes sobre como escolher os hiperparâmetros de uma arquitetura profunda, como auto-codificadores empilhados ou redes de crenças profundas. Existem muitos hiperparâmetros e estou muito confuso sobre como escolhê-los. O uso da validação cruzada também não é uma opção, pois o treinamento …

3
Aprendizagem online vs offline?
Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados ​​em ambos?

4
O que é invariância da tradução na visão computacional e na rede neural convolucional?
Não tenho experiência em visão computacional, mas quando leio alguns artigos e artigos relacionados a processamento de imagens e redes neurais convolucionais, enfrento constantemente o termo translation invariance, ou translation invariant. Ou eu li muito que a operação de convolução fornece translation invariance? !! O que isto significa? Eu mesmo …

3
Quais são as diferenças entre 'época', 'lote' e 'minibatch'?
Até onde eu sei, ao adotar a descida do gradiente estocástico como algoritmo de aprendizado, alguém usa 'época' para o conjunto de dados completo e 'lote' para dados usados ​​em uma única etapa de atualização, enquanto outro usa 'lote' e 'minibatch' respectivamente, e os outros usam 'época' e 'minibatch'. Isso …


6
Melhore a classificação com muitas variáveis ​​categóricas
Estou trabalhando em um conjunto de dados com mais de 200.000 amostras e aproximadamente 50 recursos por amostra: 10 variáveis ​​contínuas e as outras ~ 40 são variáveis ​​categóricas (países, idiomas, campos científicos etc.). Para essas variáveis ​​categóricas, você tem, por exemplo, 150 países diferentes, 50 idiomas, 50 campos científicos, …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.