Perguntas com a marcação «lstm»

Uma memória de longo prazo (LSTM) é uma arquitetura de rede neural que contém blocos NN recorrentes que podem lembrar um valor por um período arbitrário de tempo.




2
Diferença entre uma única rede LSTM e uma rede neural LSTM de 3 unidades
O LSTM no seguinte código Keras input_t = Input((4, 1)) output_t = LSTM(1)(input_t) model = Model(inputs=input_t, outputs=output_t) print(model.summary()) pode ser representado como Entendo que quando chamamos model.predict(np.array([[[1],[2],[3],[4]]]))a (apenas) unidade LSTM processa primeiro o vetor [1], depois [2] mais o feedback da entrada anterior e assim por diante até o vetor …

2
Manipulando Palavras Desconhecidas em Tarefas de Modelagem de Linguagem Usando LSTM
Para uma tarefa de processamento de linguagem natural (PNL), geralmente se usa vetores word2vec como uma incorporação para as palavras. No entanto, pode haver muitas palavras desconhecidas que não são capturadas pelos vetores word2vec simplesmente porque essas palavras não são vistas com bastante frequência nos dados de treinamento (muitas implementações …


1
Melhor maneira de inicializar o estado LSTM
Eu queria saber qual é a melhor maneira de inicializar o estado para LSTMs. Atualmente, eu apenas inicializo para todos os zeros. Realmente não consigo encontrar nada online sobre como inicializá-lo. Uma coisa que eu estava pensando em fazer é tornar o estado inicial um parâmetro treinável. Algum conselho?


1
Entendendo a topologia do LSTM
Como muitos outros, eu achei os recursos aqui e aqui imensamente úteis para entender as células LSTM. Estou confiante de que entendo como os valores fluem e são atualizados, e estou confiante o suficiente para adicionar as mencionadas "conexões do olho mágico", etc. também. No meu exemplo, tenho em cada …



3
Estrutura da rede neural recorrente (LSTM, GRU)
Estou tentando entender a arquitetura das RNNs. Encontrei este tutorial que foi muito útil: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ Especialmente esta imagem: Como isso se encaixa em uma rede de feed-forward? Essa imagem é apenas outro nó em cada camada?


2
Qual é a saída de um tf.nn.dynamic_rnn ()?
Não sei ao certo o que entendi da documentação oficial, que diz: Retorna: um par (saídas, estado) em que: outputs: O tensor de saída RNN. Se time_major == False(default), este será um Tensor em forma: [batch_size, max_time, cell.output_size]. Se time_major == True, este será um Tensor em forma: [max_time, batch_size, …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.