Fiquei me perguntando, por que é tão importante ter um aprendizado de máquina por princípios / teórico? De uma perspectiva pessoal como humano, posso entender por que o Machine Learning por princípios seria importante:
- humanos gostam de entender o que estão fazendo, encontramos beleza e satisfação em entender.
- do ponto de vista da teoria, a matemática é divertida
- quando existem princípios que orientam o design das coisas, há menos tempo gasto em adivinhações aleatórias, tentativas e erros estranhos. Se entendermos, digamos, como as redes neurais realmente funcionavam, talvez pudéssemos gastar muito mais tempo projetando-as do que as enormes quantidades de tentativas e erros que ocorrem nela agora.
- mais recentemente, se os princípios são claros e a teoria também, deve haver (espero) mais transparência no sistema. Isso é bom porque, se entendermos o que o sistema está funcionando, a IA corre o risco de muitas pessoas exagerarem e desaparecerem imediatamente.
- Os princípios parecem ser uma maneira concisa de resumir as estruturas importantes que o mundo pode ter e quando usar uma ferramenta em vez de outra.
No entanto, essas razões são suficientemente fortes para justificar um intenso estudo teórico do aprendizado de máquina? Uma das maiores críticas da teoria é que, por ser tão difícil de fazer, elas geralmente acabam estudando algum caso muito restrito ou as suposições que precisam ser trazidas tornam essencialmente os resultados inúteis. Acho que ouvi isso uma vez em uma palestra no MIT pelo criador do Tor. Que algumas das críticas a Tor que ele ouviu são o argumento teórico, mas essencialmente as pessoas nunca são capazes de provar coisas sobre os cenários reais da vida real, porque são muito complicadas.
Nesta nova era, com tanto poder e dados de computação, podemos testar nossos modelos com conjuntos de dados e conjuntos de dados reais. Podemos ver se as coisas funcionam usando empirismo. Se conseguirmos alcançar AGI ou sistemas que trabalhem com engenharia e empirismo, ainda vale a pena buscar uma justificativa teórica e de princípios para o aprendizado de máquina, especialmente quando os limites quantitativos são tão difíceis de alcançar, mas intuições e respostas qualitativas são muito mais fáceis de entender. alcançar com uma abordagem orientada a dados? Essa abordagem não estava disponível na estatística clássica, e é por isso que acho que a teoria era tão importante naqueles tempos, porque a matemática era a única maneira de termos certeza de que as coisas estavam corretas ou que elas realmente funcionavam da maneira que pensávamos.
Pessoalmente, eu sempre amei e pensei que a teoria e uma abordagem baseada em princípios eram importantes. Mas com o poder de apenas ser capaz de experimentar coisas com dados reais e poder de computação me fez pensar se o alto esforço (e recompensas potencialmente baixas) da busca teórica ainda vale a pena.
A busca teórica e de princípios do aprendizado de máquina é realmente tão importante?