Eu quero usar o aprendizado profundo para treinar uma detecção binária de face / sem face, que perda devo usar, acho que é SigmoidCrossEntropyLoss ou perda de dobradiça .
Está certo, mas também gostaria de usar o softmax, mas com apenas duas classes?
sigmoid
(como a ativação da última camada). Obrigado