O que posso usar para encontrar fotos duplicadas, incluindo fotos que foram redimensionadas?
O que posso usar para encontrar fotos duplicadas, incluindo fotos que foram redimensionadas?
Respostas:
Adicione todas as fotos à sua coleção. No menu, selecione "Ferramentas / Localizar duplicatas". Isso procurará duplicatas em toda a sua coleção.
Uma ferramenta de linha de comando. Passe todas as imagens que você deseja comparar na linha de comando.
No menu, selecione "Arquivo / Localizar duplicado". Arraste e solte arquivos de imagem na janela de duplicatas. Você pode soltar diretórios para adicionar seu conteúdo recursivamente. Para comparação visual de imagens, há opções específicas não padrão em um menu suspenso. O nível de similaridade "personalizado" permite restringir os emparelhamentos apenas ao mais alto grau de similaridade, mas deve ser definido em "Preferências" como 99. Mesmo assim, ele não funciona perfeitamente, pelo menos para alguns tipos de imagens, como arte. Infelizmente, ele não fornece um mecanismo de seleção automática com critérios racionais, como resolução, data ou o que for, a seleção automática parece escolher aleatoriamente apenas a primeira imagem encontrada como referência a preservar. A exclusão de muitas imagens pode ser extremamente lenta, pois ela tenta atualizar a contagem de resultados a cada exclusão.
Todas essas três ferramentas encontram duplicatas visuais, não apenas arquivos que são byte idêntico por byte.
fslint
é um programa gráfico que pode encontrar arquivos duplicados de qualquer tipo pelo md5sum. Se as imagens não forem idênticas, elas não serão sinalizadas como duplicadas. A imagem abaixo mostra vários arquivos PDF duplicados no meu diretório de Downloads:
Você pode alterar os parâmetros avançados de pesquisa para pesquisar por tipo de arquivo e restringir-se apenas a imagens. Isso é feito alterando os "parâmetros adicionais de localização" como find
opções de comando. Por exemplo, aqui estou procurando apenas *.jpg
arquivos (no mesmo caminho, apenas olhando para a minha pasta "Downloads":
fdupes
é uma ferramenta equivalente baseada em linha de comando. Ambos estão disponíveis nos repositórios.
Você pode usar uma ferramenta de linha de comando chamada fdupes
para encontrar arquivos duplicados (consulte man fdupes
para obter mais detalhes). Não conheço nenhuma maneira de encontrar 'duplicatas' que foram redimensionadas. Um programa que fizesse isso exigiria algum tipo de algoritmo inteligente que analisasse o conteúdo da imagem porque, quando uma imagem é redimensionada, seus dados são alterados para que os métodos tradicionais de localização duplicada não funcionassem.
O imgSeek pode encontrar duplicatas e imagens semelhantes (para poder encontrar fotos redimensionadas e com nomes de arquivos e metadados diferentes) e até pesquisar fotos com base em um esboço. Está disponível nas versões desktop e servidor.
Na verdade, eu ainda não tentei.
isk-daemon
funciona em 12,04, embora eu descobri que eu tinha para instalar a partir da fonte ( pip install
como pela página de instalação não funcionou)
O dupeGuru Picture Edition funciona muito bem e vale a pena tentar.
Eles têm um PPA do Launchpad , dupeguru
(novo pacote all-in-one) ou dupeguru-pe
(antigo pacote de edição de imagens) podem ser instalados usando os seguintes comandos:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
Visipics é um aplicativo gratuito do Windows para essa função, mas funciona muito bem no Linux, via wine, é claro (é melhor que geeqie / gqview com relação à classificação das duplicatas (os resultados da geeqie são absolutamente "não classificáveis")).
Você pode dizer para selecionar automaticamente as imagens com base em critérios como tamanho de arquivo menor, tipo não compactado, resolução mais baixa (porém não fará o contrário, você precisará fazer manualmente, o que não seria muito melhor do que fazê-lo no geeqie, exceto que a seleção não requer a retenção de Shift/ Ctrl) e até prioriza pastas (mas a última prioridade é a prioridade da pasta).
Porém, você deve prestar atenção nos links simbólicos - ele pode "aleatoriamente" selecionar para salvar um link simbólico em um arquivo enquanto exclui o arquivo real como uma "cópia". Isso é uma vergonha.