Existe uma estrutura de código aberto chamada transpect.
Sua finalidade é a conversão de documentos completos de e para formatos individuais. ( docx, TeX, html ...)
Entre outros, os docxarquivos são suportados como entrada:
https://github.com/transpect/
Se você tem git ou svn instalado, você pode simplesmente seguir este guia para uma configuração básica:
http://transpect.github.io/getting-started.html
O guia descreve a conversão de todo o docxdocumento em hub.xml(basicamente docbook + css).
Ambas MathTypee OMMLequações são traduzidas para MathMLdurante a conversão.
Você pode simplesmente extrair os mml:mathelementos do hub.xml, usando qualquer ferramenta que você gosta.
Existem módulos mais transpect, para converter hub.xmlcompletamente o formato desejado.
Isso requer mais tempo para configuração, então depende do que você pretende fazer com os resultados.
fundo
O antigo editor de equações do Word foi desenvolvido MathType.
O novo Word Equation Editor é baseado em OMML.
A MathType-Equation é exibido como uma imagem no Word.
Se você MathTypeinstalou, uma janela separada será aberta se você clicar para editar a equação.
Senão, você não pode editá-lo.
Novas equações ( OMML) podem ser editadas diretamente dentro do software Word.
OMMLe MathMLsão ambos formatos XML.
omml2mml.xslé um arquivo fornecido pela Microsoft para ir de OMMLpara MathML.
transpectusa uma variante modificada, porque o arquivo original tem várias falhas.
(Também existe mml2omml.xsl, para ir de MathMLpara OMML)
MathTypeusa uma estrutura não-XML para suas equações.
MathTypepode importar MathMLequações, mas não OMML.
MathTypeportanto, requer que o omml2mml.xslarquivo seja gerado MathMLprimeiro.
Em uma nota lateral, MathTypenem sempre preserva estilos de caractere (negrito / itálico) ao exportar para o MathML / TeX.
Para oferecer suporte a todos os tipos de equação no Word e para melhorar o desempenho da conversão, transpecté possível traduzir MathTypepara MathML.
Para sua informação: Eu sou um colaborador do projeto transpect .