Estatísticas e Big Data machine-learning

4

Como a função de ativação retilínea resolve o problema do gradiente de fuga nas redes neurais?

Encontrei a unidade linear retificada (ReLU) elogiada em vários locais como uma solução para o problema do gradiente de fuga para redes neurais. Ou seja, usa-se max (0, x) como função de ativação. Quando a ativação é positiva, é óbvio que isso é melhor do que, digamos, a função de …

40 machine-learning neural-networks deep-learning gradient-descent

2

Medidas de importância variável em florestas aleatórias

Venho brincando com florestas aleatórias para regressão e estou tendo dificuldade em descobrir exatamente o que as duas medidas de importância significam e como elas devem ser interpretadas. A importance()função fornece dois valores para cada variável: %IncMSEe IncNodePurity. Existem interpretações simples para esses 2 valores? Em IncNodePurityparticular, isso é simplesmente …

40 r machine-learning random-forest importance

7

Normalização e padronização de dados em redes neurais

Estou tentando prever o resultado de um sistema complexo usando redes neurais (RNAs). Os valores do resultado (dependentes) variam entre 0 e 10.000. As diferentes variáveis de entrada têm intervalos diferentes. Todas as variáveis têm distribuições aproximadamente normais. Considero diferentes opções para dimensionar os dados antes do treinamento. Uma opção …

40 machine-learning neural-networks multidimensional-scaling

3

Diferença entre floresta aleatória e árvores extremamente aleatórias

Entendi que Floresta Aleatória e Árvores Extremamente Aleatórias diferem no sentido de que as divisões das árvores na Floresta Aleatória são determinísticas, enquanto que são aleatórias no caso de Árvores Extremamente Aleatórias (para ser mais preciso, a próxima divisão é a melhor divisão entre divisões uniformes aleatórias nas variáveis selecionadas …

40 machine-learning correlation references random-forest

5

LDA vs word2vec

Estou tentando entender qual é a semelhança entre Alocação de Dirichlet Latente e word2vec para calcular a similaridade de palavras. Pelo que entendi, o LDA mapeia palavras para um vetor de probabilidades de tópicos latentes , enquanto o word2vec as mapeia para um vetor de números reais (relacionado à decomposição …

39 machine-learning self-study natural-language latent-variable word2vec

6

Por que recebo uma árvore de decisão com 100% de precisão?

Estou obtendo uma precisão de 100% para minha árvore de decisão. O que estou fazendo errado? Este é o meu código: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import …

38 machine-learning python cart accuracy

3

Diretriz para selecionar os hiperparâmetros no Deep Learning

Estou procurando um artigo que possa ajudar a fornecer diretrizes sobre como escolher os hiperparâmetros de uma arquitetura profunda, como auto-codificadores empilhados ou redes de crenças profundas. Existem muitos hiperparâmetros e estou muito confuso sobre como escolhê-los. O uso da validação cruzada também não é uma opção, pois o treinamento …

38 machine-learning deep-learning deep-belief-networks hyperparameter

3

Aprendizagem online vs offline?

Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados em ambos?

38 machine-learning online

4

O que é invariância da tradução na visão computacional e na rede neural convolucional?

Não tenho experiência em visão computacional, mas quando leio alguns artigos e artigos relacionados a processamento de imagens e redes neurais convolucionais, enfrento constantemente o termo translation invariance, ou translation invariant. Ou eu li muito que a operação de convolução fornece translation invariance? !! O que isto significa? Eu mesmo …

38 machine-learning conv-neural-network convolution computer-vision

3

Quais são as diferenças entre 'época', 'lote' e 'minibatch'?

Até onde eu sei, ao adotar a descida do gradiente estocástico como algoritmo de aprendizado, alguém usa 'época' para o conjunto de dados completo e 'lote' para dados usados em uma única etapa de atualização, enquanto outro usa 'lote' e 'minibatch' respectivamente, e os outros usam 'época' e 'minibatch'. Isso …

38 machine-learning

3

Variação das estimativas de validação cruzada com

TL, DR: Parece que, ao contrário do conselho muitas vezes repetida, leave-one-out validação cruzada (LOO-CV) - isto é,CV fold com(o número de dobras) igual a(o número das observações de treinamento) - produz estimativas do erro de generalização que é a menor variável para qualquer, não a mais variável, assumindo uma …

37 regression machine-learning variance cross-validation predictive-models

6

Melhore a classificação com muitas variáveis categóricas

Estou trabalhando em um conjunto de dados com mais de 200.000 amostras e aproximadamente 50 recursos por amostra: 10 variáveis contínuas e as outras ~ 40 são variáveis categóricas (países, idiomas, campos científicos etc.). Para essas variáveis categóricas, você tem, por exemplo, 150 países diferentes, 50 idiomas, 50 campos científicos, …

37 machine-learning classification categorical-data random-forest many-categories

4

Uma sólida formação em matemática é um requisito total para o ML?

Estou começando a querer aprimorar minhas próprias habilidades e sempre fui fascinado pelo aprendizado de máquina. No entanto, seis anos atrás, em vez de prosseguir com isso, decidi tomar um diploma completamente não relacionado à ciência da computação. Desenvolvo software e aplicativos há cerca de 8 a 10 anos, por …

37 machine-learning references mathematical-statistics

3

Aplicação de métodos de aprendizado de máquina nos sites StackExchange

Eu tenho um curso de Aprendizado de Máquina neste semestre e o professor nos pediu para encontrar um problema do mundo real e resolvê-lo por um dos métodos de aprendizado de máquina introduzidos na classe, como: Árvores de decisão Redes neurais artificiais Máquinas de vetores de suporte Aprendizagem baseada em …

37 machine-learning

2

Se apenas a previsão é interessante, por que usar o laço sobre a crista?

Na página 223 em Introdução ao aprendizado estatístico , os autores resumem as diferenças entre regressão de cordilheira e laço. Eles fornecem um exemplo (Figura 6.9) de quando "o laço tende a superar a regressão da crista em termos de viés, variância e MSE". Entendo por que o laço pode …

37 machine-learning prediction lasso regularization ridge-regression

Perguntas com a marcação «machine-learning»