Estou construindo uma rede neural para prever o valor de uma obra de arte com uma ampla variedade de insumos (tamanho, meio de arte etc.) e gostaria de incluir o autor como insumo (geralmente é uma enorme fator no valor de uma única obra de arte).
Minha preocupação atual é que o nome do autor não seja uma entrada numérica ideal para um NN (ou seja, se eu apenas codificar cada autor com um valor inteiro crescente, atribuirei indiretamente mais valor aos autores mais abaixo na lista -_-) . Meu pensamento era criar entradas separadas para todos os autores do meu conjunto de dados e usar apenas uma codificação quente para representar melhor a entrada para o NN.
Essa abordagem, no entanto, encontra um problema quando um autor que não está incluído nos meus dados de treinamento é usado como uma entrada para o NN (ou seja, um novo autor). Posso contornar isso com um campo de entrada "outro autor", mas estou preocupado que isso não seja preciso, pois não teria treinado o NN para essa entrada (todas as obras de arte com uma avaliação têm um autor).
Ainda não pensei muito nisso, mas pensei em talvez treinar 2 NNs, um para uma avaliação sem autor e outro para avaliação com um autor para garantir que eu tenha dados de treinamento suficientes para que uma "avaliação sem autor" ainda seja razoavelmente precisa.
Ainda estou tentando conceituar a melhor arquitetura de NN antes de ficar preso na implementação, por isso, se alguém tiver alguma sugestão / comentário, ficaria muito grato!
Agradecemos antecipadamente, Vince
PS: Estou fazendo isso como uma pequena competição com um amigo para testar um NN versus as técnicas tradicionais de avaliação comercial. Por favor, ajude-me a obter uma vitória para a Ciência da Computação sobre a Ciência Atuarial.