Usando uma camada múltipla LSTM
com desistência, é recomendável colocar desistência em todas as camadas ocultas e nas camadas densas de saída? No artigo de Hinton (que propôs o Dropout), ele apenas colocou o Dropout nas camadas densas, mas isso ocorreu porque as camadas internas ocultas eram convolucionais.
Obviamente, posso testar meu modelo específico, mas me perguntei se havia consenso sobre isso.