Estou lendo o artigo de base Sequence to Sequence Learning with Neural Networks de Ilya Sutskever e Quoc Le. Na primeira página, menciona brevemente que:
A surprising example of the power of DNNs is their ability to sort
N N-bit numbers using only 2 hidden layers of quadratic size
Alguém pode descrever brevemente como classificar números usando apenas duas camadas ocultas?