Estudei a arquitetura da rede neural siamesa introduzida por Yann LeCun e seus colegas em 1994 para o reconhecimento de assinaturas ( “Verificação de assinatura usando uma rede neural siamese com atraso de tempo” .pdf , NIPS 1994)
Entendi a idéia geral dessa arquitetura, mas realmente não consigo entender como a retropropagação funciona nesse caso. Não consigo entender quais são os valores-alvo da rede neural, que permitirão que a retropropagação defina adequadamente os pesos de cada neurônio.
Nesta arquitetura, o algoritmo calcula a semelhança de cosseno entre as representações finais das duas redes neurais. O artigo afirma: "A saída desejada é para um pequeno ângulo entre as saídas das duas sub-redes (f1 e f2) quando são apresentadas assinaturas genuínas. e um grande ângulo se uma das assinaturas for uma falsificação ".
Eu realmente não consigo entender como eles poderiam usar uma função binária (semelhança de cosseno entre dois vetores) como alvo para executar a retropropagação.
Como a retropropagação é calculada nas redes neurais siamesas?