Esta não é uma resposta completa e não tenho muita experiência em redes neurais, mas talvez seja útil.
NNs recebem essencialmente uma entrada e produzem uma resposta. Eles são treinados, através da prática, para produzir respostas semelhantes em entradas "semelhantes" no domínio, por exemplo, o mesmo rótulo para imagens do mesmo animal, ou altas classificações para "boas" posições de xadrez, onde bom significa altas chances de vitória.
Então, como eu comentei, as redes neurais são um modelo não uniforme de computação que funciona de uma maneira totalmente diferente dos algoritmos passo a passo executados nas Máquinas de Turing. Em vez disso, pense neles como circuitos "suaves" que usam matemática contínua em vez de booleana e podem ser aprimorados ou treinados e podem errar.
Por que jogar xadrez é mais fácil do que Dijkstra ou Graphisomorphism?
Parcialmente, é a diferença entre pedir a alguém que responda a uma pergunta da melhor maneira possível e pedir a resposta correta, juntamente com uma prova de que ela está correta. Parcialmente, é a diferença entre resolver um problema de tamanho fixo e resolver simultaneamente o problema para todos os tamanhos de entrada possíveis.
Cada vez Dijkstra é executado em uma instância, que pode ser de qualquer tamanho, ele implicitamente prova de que sua saída é a única resposta verdadeira e nenhum outro. No xadrez e no reconhecimento de imagens, dá-se a melhor resposta possível e erros são tolerados. Além disso, apenas treinamos redes para resolver esses problemas de um tamanho por vez. Acho que ainda não sabemos como generalizar uma solução de rede neural para, por exemplo, instâncias de problemas de tamanhos e formas totalmente diferentes.
Acho que não devemos supor que as redes neurais não possam resolver caminhos mais curtos ou problemas algorítmicos semelhantes, mas resolvem problemas de uma maneira fundamentalmente diferente de um algoritmo passo a passo que está sempre correto.
Voltando à semelhança entre redes neurais e circuitos, observe que os circuitos são estudados há décadas, mas, a julgar pela falta de respostas a (5) da minha pergunta anterior , sabemos quase nada sobre como construir circuitos totalmente corretos para um dado problema, exceto através da transformação de um algoritmo uniforme (Turing Machine) em um circuito.