Perguntas com a marcação «deep-learning»

Uma área de aprendizado de máquina relacionada ao aprendizado de representações hierárquicas dos dados, realizada principalmente com redes neurais profundas.




2
Nas redes neurais, por que usar métodos de gradiente em vez de outras metaheurísticas?
No treinamento de redes neurais profundas e rasas, por que os métodos de gradiente (por exemplo, descida de gradiente, Nesterov, Newton-Raphson) são comumente usados, em oposição a outras metaheurísticas? Por metaheurísticas, refiro-me a métodos como recozimento simulado, otimização de colônias de formigas etc., que foram desenvolvidos para evitar o empate …

2
Como e por que a Normalização de lote usa médias móveis para rastrear a precisão do modelo enquanto ele treina?
Eu estava lendo o documento de normalização em lote (BN) (1) e não entendia a necessidade de usar médias móveis para rastrear a precisão do modelo e, mesmo se eu aceitasse que era a coisa certa a fazer, não entendo o que eles estão fazendo exatamente. Para meu entendimento (o …

3
Importância do nó de viés nas redes neurais
Estou curioso para saber o quão importante é o nó de viés para a eficácia das redes neurais modernas. Eu posso entender facilmente que isso pode ser importante em uma rede superficial com apenas algumas variáveis ​​de entrada. No entanto, as redes neurais modernas, como no aprendizado profundo, geralmente têm …



5
Qual é a diferença entre 'transferência de aprendizagem' e 'adaptação de domínio'?
Existe alguma diferença entre 'transferência de aprendizado' e 'adaptação de domínio'? Não conheço o contexto, mas entendo que temos um conjunto de dados 1 e o treinamos, após o qual temos outro conjunto de dados 2 para o qual queremos adaptar nosso modelo sem precisar treinar novamente do zero, para …





2
As amostras de treinamento coletadas aleatoriamente para redes neurais de treinamento em mini-lotes devem ser coletadas sem substituição?
Definimos uma época como tendo passado por todas as amostras de treinamento disponíveis, e o tamanho do minilote como o número de amostras sobre as quais calculamos a média para encontrar as atualizações de pesos / desvios necessários para descer o gradiente. Minha pergunta é se devemos extrair sem substituição …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.