Tenho várias mensagens duplicadas no Maildir do meu servidor IMAP. Qual é a melhor maneira de removê-los?
Alguns pontos relevantes:
- O ID da mensagem compartilhada geralmente é uma definição suficientemente boa de duplicado. Um pequeno script que remove todas as mensagens duplicadas, exceto uma, funcionaria.
- Às vezes, é necessário encontrar duplicatas com base nos corpos das mensagens compartilhadas. O que é uma definição razoável de compartilhada aqui? Bitwise equivalente? E as diferenças estranhas na quebra de linha, escape e codificação de caracteres?
- Às vezes, há alguma diferença significativa entre mensagens 'duplicadas'. Qual é a melhor maneira de revisar as diferenças nos conjuntos de mensagens 'duplicadas'? Difícil?