Existe uma estrutura de código aberto chamada transpect
.
Sua finalidade é a conversão de documentos completos de e para formatos individuais. ( docx
, TeX, html ...)
Entre outros, os docx
arquivos são suportados como entrada:
https://github.com/transpect/
Se você tem git ou svn instalado, você pode simplesmente seguir este guia para uma configuração básica:
http://transpect.github.io/getting-started.html
O guia descreve a conversão de todo o docx
documento em hub.xml
(basicamente docbook + css).
Ambas MathType
e OMML
equações são traduzidas para MathML
durante a conversão.
Você pode simplesmente extrair os mml:math
elementos do hub.xml
, usando qualquer ferramenta que você gosta.
Existem módulos mais transpect, para converter hub.xml
completamente o formato desejado.
Isso requer mais tempo para configuração, então depende do que você pretende fazer com os resultados.
fundo
O antigo editor de equações do Word foi desenvolvido MathType
.
O novo Word Equation Editor é baseado em OMML
.
A MathType
-Equation é exibido como uma imagem no Word.
Se você MathType
instalou, uma janela separada será aberta se você clicar para editar a equação.
Senão, você não pode editá-lo.
Novas equações ( OMML
) podem ser editadas diretamente dentro do software Word.
OMML
e MathML
são ambos formatos XML.
omml2mml.xsl
é um arquivo fornecido pela Microsoft para ir de OMML
para MathML
.
transpect
usa uma variante modificada, porque o arquivo original tem várias falhas.
(Também existe mml2omml.xsl
, para ir de MathML
para OMML
)
MathType
usa uma estrutura não-XML para suas equações.
MathType
pode importar MathML
equações, mas não OMML
.
MathType
portanto, requer que o omml2mml.xsl
arquivo seja gerado MathML
primeiro.
Em uma nota lateral, MathType
nem sempre preserva estilos de caractere (negrito / itálico) ao exportar para o MathML / TeX.
Para oferecer suporte a todos os tipos de equação no Word e para melhorar o desempenho da conversão, transpect
é possível traduzir MathType
para MathML
.
Para sua informação: Eu sou um colaborador do projeto transpect .