Perguntas com a marcação «conv-neural-network»

Redes neurais convolucionais são um tipo de rede neural na qual existem apenas subconjuntos de conexões possíveis entre camadas para criar regiões sobrepostas. Eles são comumente usados ​​para tarefas visuais.

4
Quantos dados você precisa para uma rede neural convolucional?
Se eu tenho uma rede neural convolucional (CNN), que possui cerca de 1.000.000 de parâmetros, quantos dados de treinamento são necessários (suponha que eu esteja fazendo descida estocástica do gradiente)? Existe alguma regra de ouro? Notas adicionais: Quando realizei descida de gradiente estocástico (por exemplo, 64 amostras para 1 iteração), …


2
Inicialização de peso CNN xavier
Em alguns tutoriais, constatei que a inicialização do peso "Xavier" (artigo: Entendendo a dificuldade de treinar redes neurais profundas de avanço ) é uma maneira eficiente de inicializar os pesos das redes neurais. Para camadas totalmente conectadas, havia uma regra prática nesses tutoriais: Var(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W) = \frac{2}{n_{in} + n_{out}}, …






4
Na CNN, o upsampling e a transposição da convolução são iguais?
Os termos "upsampling" e "transpose convolution" são usados ​​quando você está executando "deconvolution" (<- não é um bom termo, mas deixe-me usá-lo aqui). Originalmente, eu pensava que eles significam a mesma coisa, mas parece-me que eles são diferentes depois de ler esses artigos. alguém pode esclarecer? Convolução de transposição : …

1
O que exatamente é um bloco de Aprendizagem Residual no contexto de Redes Residuais Profundas na Aprendizagem Profunda?
Eu estava lendo o artigo Deep Residual Learning for Image Reconhecimento e tive dificuldades em entender com 100% de certeza o que um bloco residual implica computacionalmente. Lendo o trabalho deles, eles têm a figura 2: que ilustra o que um bloco residual é suposto ser. O cálculo de um …



3
Não linearidade antes da camada Softmax final em uma rede neural convolucional
Estou estudando e tentando implementar redes neurais convolucionais, mas suponho que essa pergunta se aplique aos perceptrons multicamadas em geral. Os neurônios de saída em minha rede representam a ativação de cada classe: o neurônio mais ativo corresponde à classe prevista para uma determinada entrada. Para considerar um custo de …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.