Existem boas razões para preferir valores binários (0/1) a valores normalizados discretos ou contínuos , por exemplo (1; 3), como entradas para uma rede de feedforward para todos os nós de entrada (com ou sem retropropagação)?
Claro, estou falando apenas de entradas que podem ser transformadas em qualquer forma; por exemplo, quando você tem uma variável que pode receber vários valores, alimente-os diretamente como valor de um nó de entrada ou forme um nó binário para cada valor discreto. E a suposição é que o intervalo de valores possíveis seria o mesmo para todos os nós de entrada. Veja as fotos para um exemplo de ambas as possibilidades.
Enquanto pesquisava sobre esse tópico, não consegui encontrar fatos concretos sobre isso; parece-me que - mais ou menos - sempre será "tentativa e erro" no final. Obviamente, nós binários para cada valor de entrada discreto significam mais nós da camada de entrada (e, portanto, mais nós da camada oculta), mas realmente produziriam uma classificação de saída melhor do que os mesmos valores em um nó, com uma função de limiar adequada em a camada oculta?
Você concorda que é apenas "tentar ver", ou você tem outra opinião sobre isso?