Respostas:
Formalmente, uma única camada oculta é suficiente para aproximar uma função contínua a qualquer grau de precisão desejado; portanto, nesse sentido, você nunca precisa de mais que 1. Isso é chamado de Teorema da Aproximação Universal .
Encontrar a melhor topologia para um determinado problema é um problema de pesquisa aberto. Até onde eu sei, existem poucas 'regras básicas' universais para isso.
Para um determinado problema, uma opção é aplicar uma abordagem neuroevolucionária como a NEAT , que tenta encontrar uma topologia que funcione bem para o problema em questão.