Similaridade e / ou Diferença de dois documentos ODT (Linux)

14

Eu tenho dois documentos ODT, eles têm um conteúdo muito próximo, quero compará-los para ver como eles são semelhantes.

O melhor seria ter uma porcentagem de similaridade , se não for possível, uma alternativa seria pelo menos ter algum tipo de diferença .

Estou executando o Ubuntu Lucid .

Solução:

Eu costumava odt2txtconverter os arquivos em texto e, em seguida, wdiff -i --statistics one.txt two.txtapresentava um diff junto com as estatísticas, o que me dava a porcentagem de palavras comuns (semelhança).

ubuntu diff odt

— Weboide
fonte

possível duplicação de Como um diff binário em dois arquivos de tamanho idêntico no linux?

— 22612 James Mertz

7

Eu não os experimentei, mas esse par de ferramentas - odt2txt e oodiff - parece promissor.

— JRobert
fonte

Usei o odt2txt para convertê-los em texto e, em seguida, usei o wdiff, que fornece um diff por palavra.

— Weboide

Obrigado. Isso é ótimo para uso em sistemas de controle de versão como git ou mercurial. Veja técnicas de integração / automação no OpenDocument, diff e revision-control

— nealmcb

20

Você tentou a funcionalidade de comparação interna? Editar / comparar documento ...

Se você deseja apenas uma comparação de texto, sua melhor aposta é provavelmente converter os dois documentos em texto sem formatação e executar uma comparação regular. Você terá que descobrir como normalizar quebras de linha, caso contrário, o diff não será muito útil.

— sleske
fonte

1

Ótima função no LibreOffice, eu nunca tinha ouvido falar sobre isso! Muito útil, mas nenhuma estatística é fornecida.

— Stragu

Excelente! Eu nunca teria pensado em procurar em um menu Editar para comparar documentos. Procurei em Arquivo , Ferramentas e Janela , sendo o último o local do Word da uSoft.

— wallyk

4

Na versão mais recente, parece ser Edit -> Track Changes -> Compare Document ...

— FableBlaze

1

Se você não se importa com a formatação de texto, também pode copiar o conteúdo para arquivos de texto sem formatação e usar um bom e antigo diff.

ps: Você é um professor procurando possíveis trapaceiros? : p

— tamtakos
fonte

lol não, eu não sou um professor, mas sim que esta seria uma boa maneira de olhar para cheaters :)

— Weboide

1

A maneira como faço isso é produzir arquivos .pdf com o libreoffice e depois usar o diffpdf para comparar os dois arquivos pdf. Isso mostra as diferenças destacadas em janelas paralelas

— Peter Allott
fonte