Ciência de dados neural-network

4

O problema do gradiente de fuga pode ser resolvido multiplicando a entrada de tanh por um coeficiente?

Para meu entendimento, o problema do gradiente de fuga ocorre ao treinar redes neurais quando o gradiente de cada função de ativação é menor que 1, de modo que, quando as correções são propagadas de novo por várias camadas, o produto desses gradientes se torna muito pequeno. Sei que existem …

7 machine-learning neural-network deep-learning activation-function

2

Arquitetura de rede neural para identificar cópias de imagens

Tenho uma grande coleção de imagens e desejo identificar as imagens dessa coleção que parecem copiar outras imagens da coleção. Para dar uma idéia dos tipos de pares de imagens que desejo classificar como correspondências, considere estes exemplos: Eu classifiquei manualmente cerca de 0,25M de pares de imagens correspondentes e …

7 machine-learning neural-network convnet image-classification computer-vision

1

Como decidir a forma dos recursos de entrada, quando cada arquivo de dados tem tamanho diferente?

Para me ajudar a entender os benefícios e deficiências de decision trees, KNN, Neural Networks, eu queria construir um classificador simples que classifica em 2 classes ( Bird Sounde Non-Bird Sound) usando todos os itens acima 3 métodos. Então, eu baixei um conjunto de dados de som de Kaggle e …

7 machine-learning python neural-network decision-trees k-nn

4

Extração de recursos de um gráfico de dispersão

Digamos que eu tenha um gráfico de dispersão como este: Como tenho muitos gráficos de dispersão como esse, quero fazer a transformação de recursos, ou seja, squash (x,y)em um único termo para ser inserido em um NN. Qual transformação, como x/you (x/y)^2qualquer outra transformação, funcionará melhor nesse tipo de gráfico, …

7 machine-learning neural-network feature-extraction

1

Como desenhar diagramas de redes neurais convolucionais?

Eu tenho que desenhar um diagrama da CNN semelhante a este: Tentei todas as ferramentas mencionadas em https://datascience.stackexchange.com/a/14900 , mas não há uma maneira fácil de fazer isso. Existe alguma maneira automatizada de fazer isso? Ou eu tenho que fazer isso manualmente. Além disso, é possível desenhar isso ?: Eu …

7 machine-learning neural-network deep-learning

1

Os modelos de aprendizado profundo estão acima da capacidade necessária para as entropias estimadas de seus conjuntos de dados?

essa pergunta pode parecer um pouco estranha. Eu estava fazendo alguns auto-estudos sobre teoria da informação e decidi fazer algumas investigações mais formais sobre aprendizado profundo. Por favor, tenha paciência comigo enquanto tento explicar. Tomei um grande subconjunto de "treinamento" do MNIST como minha cobaia. 1) Converteu todas as imagens …

7 neural-network deep-learning information-theory

3

qual topologia de rede neural aprender correlações entre séries temporais?

Tenho duas (ou mais, em princípio) séries temporais 1xN e gostaria de treinar um NN para prever o próximo valor de ambos. Posso organizá-los como uma matriz 2xN e alimentar uma janela dessa matriz como entrada para o NN, mas não sei como estruturar o próprio NN. Eu fiz um …

7 machine-learning neural-network time-series correlation

1

Como obter uma pontuação de confiança para as previsões?

Em um problema de regressão, é possível calcular uma pontuação de confiança / confiabilidade para uma determinada previsão, considerando modelos como XGBoost ou Neural Networks?

7 machine-learning neural-network regression decision-trees xgboost

1

Por que a ReLU com vazamento nem sempre é preferível à ReLU, dado o gradiente zero para x <0?

Parece-me que o ReLU com vazamento deve ter um desempenho muito melhor, pois o ReLU padrão não pode usar metade de seu espaço (x <0, onde o gradiente é zero). Mas isso não acontece e, na prática, a maioria das pessoas usa ReLU padrão.

7 neural-network gradient-descent

1

Após a fase de treinamento, é melhor executar redes neurais em uma GPU ou CPU?

Meu entendimento é que as GPUs são mais eficientes para executar redes neurais, mas alguém recentemente me sugeriu que as GPUs são necessárias apenas para a fase de treinamento. Depois de treinado, é realmente mais eficiente executá-los em CPUs. Isso é verdade?

7 neural-network deep-learning gpu

1

Rede neural com número flexível de entradas?

É possível criar uma rede neural que forneça uma saída consistente, uma vez que a entrada pode estar em diferentes vetores de comprimento? Atualmente, estou em uma situação em que coletei muitos arquivos de áudio, de diferentes comprimentos, e tenho que treinar uma rede neural que me fornece a saída …

7 neural-network regression tensorflow supervised-learning audio-recognition

1

Propagação posterior: nos métodos de segunda ordem, a derivada ReLU seria 0? e qual o seu efeito no treinamento?

ReLU é uma função de ativação definida como h=max(0,a)h=max(0,a)h = \max(0, a)onde .a=Wx+ba=Wx+ba = Wx + b Normalmente, treinamos redes neurais com métodos de primeira ordem, como SGD, Adam, RMSprop, Adadelta ou Adagrad. A retropropagação em métodos de primeira ordem requer derivada de primeira ordem. Portanto é derivado de .xxx111 …

7 neural-network optimization backpropagation

2

Como atualizar o viés e o peso do viés usando o algoritmo de retropropagação

Estou escrevendo meu próprio algoritmo de treinamento, mas não sei como definir o peso do viés. Preciso definir viés em qualquer camada? O peso do viés deve ser atualizado em todas as camadas?

7 machine-learning neural-network backpropagation

1

Redes neurais: Posso usar sigmoides e tanh como funções de ativação?

Em uma arquitetura de rede neural, posso usar a função sigmóide em algumas camadas e a função tanh em outras? É uma boa escolha?

7 neural-network

1

Redes Neurais: Como preparar dados do mundo real para detectar eventos de baixa probabilidade?

Eu tenho um conjunto de dados do mundo real de tomadores de crédito (50.000 registros). O conjunto contém categorias como Casado, Solteiro, Divorciado, etc., além de dados contínuos, como Renda, Idade, etc. Alguns registros estão incompletos ou contêm discrepâncias. A variável dependente é Padrão / Bom (0,1). Estamos tentando treinar …

7 machine-learning neural-network data-cleaning forecast

Perguntas com a marcação «neural-network»