Eu tenho muitos arquivos que preciso classificar; e, infelizmente, existem muitos arquivos com o mesmo nome, mas com conteúdo diferente, e há o mesmo conteúdo com nomes de arquivos diferentes.
Estou pensando em usar md5sum
para gerar somas de verificação para os arquivos, mas preciso saber - é possível que dois arquivos diferentes (ou seja, conteúdo diferente) gerem a mesma soma de verificação?
Se for, qual a probabilidade de isso acontecer?
Seria possível usar dois programas de soma de verificação diferentes e não relacionados (por exemplo, não na mesma "família") para gerar duas somas de verificação - supondo que enquanto dois arquivos diferentes possam gerar a mesma soma de verificação para qualquer um dos programas de soma de verificação, isso nunca aconteceria aos dois ao mesmo tempo?