Desculpa-se pelo uso indevido de termos técnicos. Estou trabalhando em um projeto de segmentação semântica via redes neurais convolucionais (CNNs); tentando implementar uma arquitetura do tipo Encoder-Decoder, portanto, a saída é do mesmo tamanho que a entrada.
Como você cria os rótulos? Que função de perda se deve aplicar? Especialmente na situação de desequilíbrio de classe pesado (mas a proporção entre as classes é variável de imagem para imagem).
O problema lida com duas classes (objetos de interesse e histórico). Estou usando o Keras com back-end de tensorflow.
Até agora, vou projetar as saídas esperadas para ter as mesmas dimensões que as imagens de entrada, aplicando a rotulação em pixels. A camada final do modelo possui ativação softmax (para 2 classes) ou ativação sigmóide (para expressar a probabilidade de os pixels pertencerem à classe de objetos). Estou tendo problemas para projetar uma função objetiva adequada para essa tarefa, do tipo:
function(y_pred,y_true)
,
de acordo com Keras .
Por favor, tente ser específico com as dimensões dos tensores envolvidos (entrada / saída do modelo). Quaisquer pensamentos e sugestões são muito apreciados. Obrigado !