Alguém conhece uma boa aplicação para fazê-la de forma rápida e eficiente?
Comprei o Word Cleaner, mas os resultados são apenas suficientes e preciso revisar todos os arquivos html gerados para limpar toneladas de tags injetadas inúteis, como
<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>
A maioria dos artigos exibidos em um site que eu gerencio é baseada em documentos escritos no MS Word por pessoas que têm pouca idéia do que são margens ou listas ordenadas / não ordenadas, notas de rodapé / final etc. e não posso fazê-las usar outra coisa.
Alguém tem uma dica para me ajudar a lidar com essas páginas com mais eficiência do que revisá-las para corrigir e aplicar meu estilo CSS?
Nota: Apenas para o registro, usar "Salvar como HTML DOC" no Word é muito pior do que o limpador de palavras