As pessoas que fabricam o TinEye têm um produto chamado PixMatch, que pode pesquisar coleções individuais. Porém, não é implementado como um aplicativo de desktop - é uma API baseada em servidor. E parece ser precificado para uso corporativo sério, não para indivíduos. Então está aí , mas não é realmente uma resposta.
Mas uma empresa concorrente tem algo para a área de trabalho - a Imense Similar Similar Image Search , executada no Apple Mac OS ou no Microsoft Windows com o Adobe Bridge CS4 . É gratuito para coleções de até 4000 e parece ter preços razoáveis acima disso.
De fato, existem muitas coisas, depois que eu descobri o que procurar: Recuperação de imagens com base em conteúdo . Na verdade, há muito trabalho nessa área e muitas ferramentas de código aberto e fechadas . A maioria deles está focada no lado das grandes empresas / academia e está em vários estados de conclusão e aprimoramento.
Destes, acho que o imgSeek é o mais interessante para o desktop. Isso é baseado em Python / QT e, portanto, em teoria, deve ser executado em praticamente qualquer plataforma, mas é focado no Linux. Ele faz comparações baseadas em metadados (data, hora etc.), recursos simples, como luminosidade ou cor média, ou por sofisticada estimativa de similaridade baseada em wavelets . Provavelmente é um exagero encontrar a mesma imagem em um tamanho diferente com uma compressão diferente, mas deve funcionar muito bem, já que esse é basicamente o caso mais fácil possível. Também encontrará correspondências próximas, como esta:
Tudo isso pode dar muito trabalho para esse problema único específico. Como são armazenadas suas fotos não organizadas? Mesmo que seus nomes de arquivos não sejam úteis, os metadados EXIF ainda devem ser bons. Uma abordagem simples é importá-los para um programa que pode examinar esses dados e pesquisar ou classificá-los. Ou, você pode usar um programa como o jhead para renomeá-los todos, para que eles tenham nomes sensatos baseados em datas. (Talvez ambos.)