A capacidade de reconhecimento de padrões das CNNs é limitada ao processamento de imagens?


21

Uma Rede Neural Convolucional pode ser usada para reconhecimento de padrões em um domínio problemático em que não há imagens pré-existentes, digamos, representando dados abstratos graficamente? Isso sempre seria menos eficiente?

Esse desenvolvedor diz que o desenvolvimento atual pode ir além, mas não se houver um limite fora do reconhecimento de imagem.


1
Eu vejo pelo menos duas perguntas aqui. Como você pensa em se separar? Além disso, a pergunta teria uma qualidade muito mais alta se você pudesse expandir o que pesquisou na pergunta do título.
Eric Platon

@EricPlaton Apertou um pouco. Minha principal pergunta é sobre a natureza do relacionamento entre CNNs e imagens. Qual seria sua sugestão para a segunda pergunta?
Dynrepsys 4/08/16

Obrigado, a pergunta é boa para mim (embora eu deva excluir minha resposta agora ~). Quanto à segunda pergunta, que tal uma abordagem "qual é o problema"? "É sempre menos eficiente?" ainda é bom se alguém puder criar um contra-exemplo.
Eric Platon

Por "Uma rede neural convolucional pode ser usada para reconhecimento de padrões em um domínio problemático em que não há imagens pré-existentes, digamos, representando dados abstratos graficamente?" você está perguntando se podemos representar algum dado como imagem e aplicar uma CNN? Como ler um conjunto de dados com 100 recursos e representá-lo como uma imagem 10x10?
Rcpinto 7/08

Respostas:


10

As redes convolucionais (CNN) dependem de convolução matemática (por exemplo, convoluções 2D ou 3D), que é comumente usada para processamento de sinal. As imagens são um tipo de sinal e a convolução pode ser igualmente usada em sons, vibrações etc. Portanto, em princípio, as CNNs podem encontrar aplicações para qualquer sinal e, provavelmente, mais.

Na prática, já existe trabalho sobre PNL (como mencionado por Matthew Graves), onde algumas pessoas processam texto com CNNs em vez de redes recursivas. Alguns outros trabalhos se aplicam ao processamento de som (nenhuma referência aqui, mas ainda tenho trabalhos não publicados em andamento).


Conteúdo original: em resposta à pergunta do título original, que foi alterada agora. Talvez seja necessário excluir este .

Pesquisas em redes adversárias (e relacionadas) mostram que mesmo redes profundas podem ser facilmente enganadas , levando-as a ver um cachorro (ou qualquer outro objeto) no que parece ser ruído aleatório quando um ser humano olha para ela (o artigo tem exemplos claros).

Outra questão é o poder de generalização de uma rede neural. As redes convolucionais surpreenderam o mundo com sua capacidade de generalizar muito melhor do que outras técnicas. Mas se a rede receber apenas imagens de gatos, ela reconhecerá apenas gatos (e provavelmente verá gatos em todos os lugares, como pelos resultados adversos da rede). Em outras palavras, até as CNs têm dificuldade em generalizar muito além do que aprenderam.

É difícil definir com precisão o limite de reconhecimento. Eu diria simplesmente que a diversidade dos dados de aprendizado ultrapassa o limite (presumo que mais detalhes devam levar a um local mais apropriado para a discussão).


5

A resposta simples é "não, eles não estão limitados a imagens": as CNNs também estão sendo usadas para processamento de linguagem natural. (Veja aqui uma introdução.)

Ainda não os vi aplicados a dados gráficos, mas não os observei; há algumas coisas óbvias para tentar e, por isso, estou otimista de que funcionaria.


3

A rede neural convolucional pode ser aplicada não apenas para reconhecimento de imagem, mas também para análise e reconhecimento de vídeo, processamento de linguagem natural, em jogos (por exemplo, Go ) ou mesmo para descoberta de drogas , prevendo a interação entre moléculas e proteínas biológicas wiki .

Portanto, ele pode ser usado para vários problemas usando camadas convolucionais e de subamostragem conectadas a camadas mais totalmente conectadas. Eles são mais fáceis de treinar, porque têm menos parâmetros do que redes totalmente conectadas com o mesmo número de unidades ocultas. UFLDL


3

Uma rede neural convolucional pode ser usada sempre que os padrões são localmente correlacionados e traduzíveis (como em deslocáveis). É esse o caso, porque as CNNs contêm filtros que procuram determinados padrões locais em todos os lugares da entrada. Você encontrará padrões locais e traduzíveis em figuras, textos, séries temporais etc.

Não faz muito sentido usar CNNs se seus dados forem mais como um pacote de recursos com um pedido irrelevante. Nesse caso, você pode ter problemas para detectar padrões que contêm recursos que estão mais distantes no seu vetor de entrada. Você não encontrará padrões locais e traduzíveis em seus dados se puder reordenar os pontos de dados dos vetores de entrada sem perder informações.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.