Na CNN, aprenderemos filtros para produzir um mapa de características na camada convolucional.
No Autoencoder, a única unidade oculta de cada camada pode ser considerada como filtro.
Qual a diferença entre os filtros aprendidos nessas duas redes?
Na CNN, aprenderemos filtros para produzir um mapa de características na camada convolucional.
No Autoencoder, a única unidade oculta de cada camada pode ser considerada como filtro.
Qual a diferença entre os filtros aprendidos nessas duas redes?
Respostas:
No caso de filtros CNN, são aplicados pequenos patches de uma imagem em cada local possível (o que também os torna invariantes na tradução).
As camadas ocultas do codificador automático recebem a imagem inteira (saída da camada anterior) como entrada, o que não parece uma boa ideia para imagens: geralmente apenas os recursos locais espacialmente se correlacionam, enquanto os mais distantes são menos correlacionados. Além disso, esses neurônios ocultos não são invariantes à tradução.
Assim, as CNNs são como RNAs usuais com um tipo especial de regularização, que zera a maioria dos pesos para fazer uso da localidade.