Respostas:
O dupeGuru Music Edition é o que você deseja. Defina o tipo de digitalização para "Conteúdo de áudio" em Preferências. Observe que o programa é fairware, por isso, contribua se puder.
Sugiro que você junte isso ao MusicBrainz Picard, que pode marcar seus arquivos de música automaticamente.
dupeguru_me
.
Há um plugin que foi criado há algum tempo para isso. Eu usei recentemente, mas ainda deixa um pouco a desejar. Existe um " PPA " para ele - mas ainda não há pacotes construídos, apenas a filial do Bazaar. As instruções de instalação são mais ou menos assim:
wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz
Se você estiver interessado em usar o código-fonte do Bazaar, faça o seguinte:
mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source
Depois de instalado, reinicie o Rhythmbox e você deverá ter um Duplicates Finder agora na lista de plugins.
Após ativá-lo - há opções de configuração adicionais disponíveis.
Depois que o plug-in estiver ativado - e quando encontrar duplicatas - ele adicionará uma opção adicional à sua lista de bibliotecas:
Algumas configurações que achei "estranhas" - tentei isso em uma biblioteca de mídia com mais de 120.000 músicas (mais de 1.000 duplicatas) e uma biblioteca com cerca de 1.000 músicas e talvez 30 duplicatas. No primeiro, demorou MUITO tempo e travou o Rhythmbox várias vezes durante a pesquisa. Por fim, fui automaticamente com "Remover da biblioteca" para evitar a reconstrução da lista. Em bibliotecas menores, tudo funciona muito bem.
Quando uma duplicata é encontrada - se você tiver as opções padrão selecionadas - a versão de menor qualidade da música será adicionada à lista. Portanto, é seguro selecionar todas as músicas na lista Duplicatas e "Remover" (exclua do disco ou remova da biblioteca).
Você pode usar o fdupes para isso:
$ fdupes -r ~/Music
que fornece uma lista de todos os arquivos duplicados.
Você pode instalá-lo facilmente com
sudo apt-get install fdupes
Corri para um problema semelhante quando tinha um monte de arquivos de imagem duplicados. No meu caso, eu apenas usei md5sum
nos arquivos e classifiquei os resultados:
for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort
Arquivos com o mesmo conteúdo geraram o mesmo hash, portanto, duplicatas podem ser encontradas facilmente. Excluí manualmente os dupes de lá, embora pudesse ter estendido o script para excluir todos, exceto a primeira ocorrência, mas estou sempre paranóico em fazer isso em um script ad-hoc.
Observe que isso funciona apenas para arquivos duplicados com conteúdo idêntico .
find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Experimente FSlint ou dupe gredtter
Para instalar o tipo FSlint no terminal (Ctrl-Alt-T)
sudo apt-get install fslint
espero que isso seja útil ..
Eu usei o FSlint para encontrar arquivos duplicados em geral. FSlint é "um utilitário para encontrar e limpar várias formas de cotão em um sistema de arquivos".