Meu Ph.D. está em matemática pura, e admito que não sei muito (ou seja, nada) sobre CS teórico. No entanto, comecei a explorar opções não acadêmicas para minha carreira e, ao me apresentar ao aprendizado de máquina, deparei-me com afirmações como "Ninguém entende por que as redes neurais funcionam bem", o que achei interessante.
Minha pergunta, essencialmente, é que tipo de respostas os pesquisadores desejam? Aqui está o que eu encontrei na minha breve pesquisa sobre o tema:
- Os algoritmos que implementam redes neurais simples são bem diretos.
- O processo de SGD é bem compreendido matematicamente, assim como a teoria estatística.
- O teorema da aproximação universal é poderoso e comprovado.
- Existe um bom artigo recente https://arxiv.org/abs/1608.08225, que essencialmente dá a resposta de que a aproximação universal é muito mais do que realmente precisamos na prática, porque podemos fazer fortes suposições simplificadoras sobre as funções que estamos tentando modelar com o método rede neural.
No artigo mencionado acima, eles declaram (parafraseando) "os algoritmos GOFAI são totalmente compreendidos analiticamente, mas muitos algoritmos da RNA são entendidos apenas heuristicamente". Os teoremas de convergência para os algoritmos implementados são um exemplo de entendimento analítico que parece que temos sobre redes neurais; portanto, uma afirmação nesse nível de generalidade não me diz muito sobre o que é conhecido versus o desconhecido ou o que seria considerado "uma resposta . "
Os autores sugerem na conclusão que questões como limites efetivos no tamanho da rede neural necessária para aproximar um determinado polinômio são abertas e interessantes. Quais são outros exemplos de perguntas analíticas matematicamente específicas que precisariam ser respondidas para dizer que "entendemos" as redes neurais? Existem perguntas que podem ser respondidas em linguagem matemática mais pura?
(Estou pensando especificamente em métodos na teoria das representações devido ao uso da física neste artigo - e, egoisticamente, porque é o meu campo de estudo. No entanto, também posso imaginar áreas como combinatória / teoria dos grafos, geometria algébrica. e topologia, fornecendo ferramentas viáveis.)