Respostas:
O LSTM possui um conjunto de 2 matrizes: U e W para cada um dos (3) portões. O (.) No diagrama indica a multiplicação dessas matrizes com a entrada saída .
No entanto, caso o seu LSTM inclua vetores de polarização ( este é o padrão no keras, por exemplo ), o número se torna:
De acordo com isso :
Estrutura celular LSTM
Equações LSTM
Ingoring não linearidades
Se a entrada x_t for do tamanho n × 1 e houver d células de memória, o tamanho de cada um de W ∗ e U ∗ será d × n , e d × d resp. O tamanho de W será então 4d × (n + d) . Observe que cada uma das células de memória dd possui seus próprios pesos W ∗ e U ∗ e que os únicos valores de células de memória compartilhados com outras unidades LSTM são durante o produto com U ∗ .
Agradecemos a Arun Mallya pela ótima apresentação.