Qualquer ferramenta de soma de verificação faria bem em localizar arquivos duplicados normalmente.
Mas, com arquivos de mídia, um leve processamento (ou edição de tags) altera a soma de verificação,
tornando inúteis as comparações baseadas em hash.
Dependendo do estado de suas cópias, você pode identificar duplicatas com base em,
- nomes de arquivo
- Tag
- soma de verificação / hashes (md5sum)
Já existem várias respostas aqui que suportam essas verificações.
O que importa é o tipo de duplicata que você possui.