RNN
arquiteturas gostam LSTM
e BiLSTM
são usadas em ocasiões em que o problema de aprendizado é seqüencial; por exemplo, você tem um vídeo e deseja saber o que é tudo isso ou deseja que um agente leia uma linha de documento para você, que é uma imagem de texto e não no formato de texto. É altamente recomendável que você dê uma olhada aqui .
LSTMs
e suas variantes bidirecionais são populares porque tentaram aprender como e quando esquecer e quando não usar portas em sua arquitetura. Em RNN
arquiteturas anteriores , o desaparecimento de gradientes era um grande problema e fazia com que essas redes não aprendessem muito.
Usando Bidirecional LSTMs
, você alimenta o algoritmo de aprendizado com os dados originais uma vez do começo ao fim e uma vez do fim ao começo. Existem debates aqui, mas geralmente ele aprende mais rápido que a abordagem unidirecional, embora dependa da tarefa.
Sim, você pode usá-los também em aprendizado não supervisionado, dependendo da sua tarefa. dê uma olhada aqui e aqui .