Sistemas subdeterminados só são subdeterminados se você não impuser outras restrições além dos dados. Seguindo o seu exemplo, encaixar um polinômio de 4 graus em 4 pontos de dados significa que você tem um grau de liberdade não restrito pelos dados, o que deixa uma linha (em espaço coeficiente) de soluções igualmente boas. No entanto, você pode usar várias técnicas de regularização para tornar o problema tratável. Por exemplo, ao impor uma penalidade à norma L2 (ou seja, a soma dos quadrados) dos coeficientes, você garante que sempre exista uma solução única com a melhor adequação.
Também existem técnicas de regularização para redes neurais; portanto, a resposta curta para sua pergunta é 'sim, você pode'. De particular interesse é uma técnica chamada "desistência", na qual, para cada atualização dos pesos, você 'descarta' aleatoriamente um determinado subconjunto de nós da rede. Ou seja, para essa iteração específica do algoritmo de aprendizado, você finge que esses nós não existem. Sem desistência, a rede pode aprender representações muito complexas da entrada que dependem de todos os nós trabalhando juntos da maneira certa. É provável que essas representações 'memorizem' os dados de treinamento, em vez de encontrar padrões que generalizem. A desistência garante que a rede não possa usar todos os nós de uma vez para ajustar os dados de treinamento; ele deve ser capaz de representar bem os dados, mesmo quando alguns nós estão ausentes,
Observe também que, ao usar o abandono, os graus de liberdade em um determinado momento durante o treinamento podem ser realmente menores que o número de amostras de treinamento, mesmo que no total você esteja aprendendo mais pesos do que as amostras de treinamento.