Como salvar documentos do Word como HTML para serem visualizados no Firefox


10

Estou precisando salvar um documento do Word como HTML. Possui algumas imagens de plano de fundo, outras imagens, textos, ... Abre corretamente no Internet Explorer, mas como posso salvar uma palavra doc como HTML para que o Firefox e outros navegadores atuais a processem corretamente?

Todas as imagens estão ausentes no documento. Examinei o documento html gerado, mas os caminhos para as imagens parecem estar corretos.

Qualquer ideia?

Coisas como "Não salvar documentos como html" não serão úteis aqui.

Editar: para deixar claro, o normal "Salvar como HTML" não é necessário, o resultado é quebrado em qualquer navegador que não seja o Internet Explorer.

Edição 2: O que estou usando é o Word 2010 e o Firefox 4. Também tentei renderizá-lo na versão mais recente do Chrome, que também falhou. Usei diferentes configurações de compatibilidade para salvar como html, isso não ajudou


2
Você pode fornecer uma captura de tela (ou captura de tela parcial) nos mostrando de que maneira falha?
Majenko 9/04

Não desse documento específico, descreverei; se não o suficiente, criarei algo novo. Tenho uma palavra doc com imagem de plano de fundo em toda a página, tenho outras imagens em vários locais e formatei o texto na página. O HTML resultante é um plano de fundo branco, sem imagens, apenas o texto formatado.
abr_

2
usar a palavra html é uma ideia horrível em geral. Estou curioso de como fazer o upload para o Google Docs e usando sua função de saída html, ou OOo usign / libreoffice para exportação iria trabalhar tho
Journeyman Geek

Não posso ajudar sobre o próprio documento do Word. O Google Docs mostra a imagem, mas destrói o formato inteiro ainda mais do que o Word Export. Eu não tentei OOo ainda, não o tem instalado agora
private_meta

Apenas testado no Open Office (3.2. *). Parece ok em Abrir Office Writer, mas quebra quando visualizados em um navegador
private_meta

Respostas:


6

Ao usar o Word Salvar como página da Web (htm html), imediatamente antes de clicar em Salvar, observe o menu suspenso "Ferramentas" à esquerda do botão Salvar. Vá para este menu suspenso, clique em Opções da Web. Na caixa de opções que aparece, desmarque a caixa "Confie na VML ..." Isso funcionou muito bem para mim. Boa sorte.


Qual versão do Word você tinha? Eu olhei para 2003 e todos parecem ter "Confie na VML ..." desmarcada por padrão.
Stephen

4

Eu tenho um hack que envolve a modificação direta do código HTML. Estou usando o MS-Office 2007 e o FF 10.0.4.

O truque é remover a <v:imagedata src = ...>amostra que o Word gera quando você salva um arquivo em HTML e substitui-o pelo padrão <img src = ...>. O primeiro (imagedata ...) só pode ser renderizado pelo IE, enquanto o último é padrão e pode ser manipulado por todos os navegadores.

Exemplo:

Remova o seguinte -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

Com:

<img src="dcsl_overview_files/image006.png" alt="overview figure">

2

Eu encontrei o mesmo problema. Parece que, por alguns motivos, o Word exporta HTML comum para alguns documentos.

Normalmente, o Word exporta gráficos com dois códigos: um especial para renderização no IE e HTML comum para os outros navegadores.

O código se parece abaixo (removi muito do código para facilitar a leitura)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Observe o condicional?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Para alguns documentos, vejo que o Word deixa de ser bilíngue e exporta apenas a parte do IE.

Ainda não tenho a solução para esses casos. Ainda investigando


2

Tente salvar como página da Web, filtro para remover as tags específicas do Office. No Word 2007, isso limpa todas as tags feias do escritório e gera um arquivo html limpo.


1

Eu tentei apenas um documento simples, renderizado no Chrome, então YMMV - mas você tentou salvar como Web Page, Filtered(disponível na minha cópia do Word 2010, e suponho em todas as versões).

Isso deve eliminar muitas das piores coisas, mas ainda assim, a saída pode nem sempre ser perfeita, HTML neutro no navegador.


0

Na barra de ferramentas de acesso rápido, há uma opção chamada visualização da página da Web . Eu acho que isso deve funcionar (eu testei quando tinha o Word 2007 e não sei se ele está disponível em 2010 e 2013).


-2

Como aparentemente nada mais funcionou, tornou-se uma dessas malditas soluções "IE only".

Edit: Apenas para esclarecer: eu mesmo respondi isso porque não recebi nenhuma outra resposta por 8 meses. Como não estou mais precisando da solução no momento e há muito tempo, não vou aceitar outra solução.


Outras pessoas podem encontrar o mesmo problema, inclusive eu. Portanto, é uma pergunta muito útil. Por favor, seja gentil o suficiente e marque a resposta que você acha que resolve o problema. Pessoalmente, acho que a @Saurabh Bagchi responde uma boa solução.
Alin C
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.