Tenho uma grande coleção de imagens e desejo identificar as imagens dessa coleção que parecem copiar outras imagens da coleção.
Para dar uma idéia dos tipos de pares de imagens que desejo classificar como correspondências, considere estes exemplos:
Eu classifiquei manualmente cerca de 0,25M de pares de imagens correspondentes e agora desejo usar essas correspondências rotuladas à mão para treinar um modelo de rede neural. Só não tenho certeza de qual arquitetura seria ideal para esta tarefa.
Originalmente, pensei que uma rede siamesa poderia ser apropriada, pois elas foram usadas para tarefas semelhantes, mas a saída desses classificadores parece ser mais ideal para encontrar diferentes figuras do mesmo objeto (que não é o que eu quero), em vez de impressões diferentes da mesma figura (que é o que eu quero).
Se alguém puder ajudar a recomendar papéis ou arquiteturas ideais para identificar imagens, com base nos dados de treinamento que eu preparei, ficaria imensamente grato por todas as idéias que você puder oferecer.