Para impulsionar, classificadores fracos ou instáveis são usados como alunos de base. É esse o caso, pois o objetivo é gerar limites de decisão consideravelmente diferentes. Então, um bom aluno de base é altamente tendencioso, ou seja, o resultado permanece basicamente o mesmo, mesmo quando os parâmetros de treinamento para os alunos de base são ligeiramente alterados.
Nas redes neurais, o abandono é uma técnica de regularização que pode ser comparada a conjuntos de treinamento. A diferença é que o conjunto é feito no espaço latente (neurônios existem ou não), diminuindo o erro de generalização.
"Cada exemplo de treinamento pode, portanto, ser visto como fornecendo gradientes para uma arquitetura diferente, amostrada aleatoriamente, de modo que a rede neural final represente eficientemente um enorme conjunto de redes neurais, com boa capacidade de generalização" - citando aqui .
Existem duas técnicas: no dropout, os neurônios são eliminados (o que significa que os neurônios existem ou não com uma certa probabilidade), enquanto no dropconnect os pesos são descartados.
Agora, para responder sua pergunta, acredito que as redes neurais (ou perceptrons) não são usadas como alunos de base em uma configuração de reforço, pois são mais lentas para treinar (leva muito tempo) e os alunos não são tão fracos, embora possam ser configurado para ficar mais instável. Então, não vale a pena o esforço.
Pode ter havido pesquisas sobre esse tópico, no entanto, é uma pena que idéias que não funcionem bem nem sempre sejam publicadas com êxito. Precisamos de mais pesquisas sobre caminhos que não levam a lugar algum, também conhecido como "não se preocupe em tentar isso".
EDITAR:
Eu pensei um pouco mais sobre isso e se você está interessado em conjuntos de redes grandes, talvez esteja se referindo a métodos de combinar as saídas de várias redes desse tipo. A maioria das pessoas faz a média ou usa a maioria dos votos, dependendo da tarefa - isso pode não ser o ideal. Eu acredito que deve ser possível alterar os pesos para cada saída da rede de acordo com o erro em um registro específico. Quanto menos correlacionadas as saídas, melhor será sua regra de montagem.