Respostas:
Um recurso muito bom é o FAQ da Rede Neural . A questão depende muito do seu problema. Se o problema é linear por natureza, não há razão para ter camadas ocultas. Se o problema não for linear, geralmente uma única camada oculta com cerca de 10 neurônios ocultos fará o truque.
Há uma pergunta muito semelhante (com uma resposta muito semelhante) no CrossValidated: Como escolher o número de camadas e nós ocultos em uma rede neural feedforward? )