Não foi possível encontrar nenhuma documentação oficial (nenhuma surpresa aí), mas de acordo com este artigo interessante , esses elementos são injetados para permitir que o Word converta o HTML de volta a um documento Word totalmente compatível, com tudo preservado.
O parágrafo relevante:
A Microsoft adicionou as tags especiais ao HTML do Word visando a compatibilidade com versões anteriores. A Microsoft queria que você pudesse salvar arquivos em HTML completos com todo o rastreamento, comentários, formatação e outros recursos especiais do Word encontrados em arquivos DOC tradicionais. Se você salvar um arquivo em HTML e depois recarregá-lo no Word, teoricamente não perderá nada.
Isso faz muito sentido.
Para sua pergunta específica ... o o
em <o:p>
significa "espaço de nomes do Office", portanto, qualquer coisa após o:
em uma tag significa "Eu faço parte do espaço de nomes do Office" - no caso de <o:p>
significar apenas um parágrafo, o equivalente à <p>
marca comum .
Presumo que cada tag HTML tem seu "equivalente" do Office e eles têm mais.