Eu tenho dois documentos ODT, eles têm um conteúdo muito próximo, quero compará-los para ver como eles são semelhantes.
O melhor seria ter uma porcentagem de similaridade , se não for possível, uma alternativa seria pelo menos ter algum tipo de diferença .
Estou executando o Ubuntu Lucid .
Solução:
Eu costumava odt2txt
converter os arquivos em texto e, em seguida, wdiff -i --statistics one.txt two.txt
apresentava um diff junto com as estatísticas, o que me dava a porcentagem de palavras comuns (semelhança).