Essa é uma pergunta interessante, no entanto, falta um esclarecimento adequado sobre o que é considerado uma rede neural convolucional .
É o único requisito que a rede precisa incluir uma operação de convolução? Precisa incluir apenas operações de convolução? As operações de pool são admitidas? As redes convolucionais usadas na prática usam uma combinação de operações, geralmente incluindo camadas totalmente conectadas (assim que você tem camadas totalmente conectadas, você tem a capacidade de aproximação universal teórica).
Para fornecer algumas respostas, considere o seguinte caso: Uma camada totalmente conectada com entradas e saídas é realizada usando uma matriz de pesos . Você pode simular esta operação usando 2 camadas de convolução:K W ∈ R K × DDKW∈ RK× D
O primeiro tem uma filtros de forma . O elemento do filtro é igual a , o restante são zeros. Essa camada transforma a entrada no espaço intermediário dimensional , onde cada dimensão representa um produto de um peso e sua entrada correspondente.D d k , d W k , d K DK× DDdk,dWk,dKD
A segunda camada contém filtros da forma . Os elementos do filtro são uns, o restante são zeros. Essa camada executa a soma dos produtos da camada anterior.K D k D … ( k + 1 ) D kKKDkD…(k+1)Dk
Essa rede convolucional simula uma rede totalmente conectada e, portanto, possui os mesmos recursos de aproximação universal. Cabe a você considerar como esse exemplo é útil na prática, mas espero que ele responda à sua pergunta.