Converter Word para HTML em Java

Converter Word para HTML em Java

Esta postagem de blog é para você, se deseja desenvolver um conversor de Word para HTML para seu aplicativo de negócios. Você pode instalar esta biblioteca do Java Word para converter arquivos Docx para outros formatos populares, como HTML, PNG, PDF e muito mais. No entanto, ao final deste tutorial, você deve ter um bom conhecimento desta biblioteca Java de conversão de arquivos. Portanto, vamos começar o artigo e aprender como converter Word para HTML em Java programaticamente.

Serão abordados os seguintes pontos:

Instalação da biblioteca Java Word

O processo de instalação desta biblioteca é muito amigável ao desenvolvedor, pois você encontra documentação abrangente sobre desenvolvimento e instalação. Assim, você pode baixar o arquivo JAR ou instalar esta biblioteca usando as seguintes configurações do Maven.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Converter Word para HTML em Java

Você está pronto para escrever o código-fonte em seu aplicativo Java para criar o conversor de Word para HTML programaticamente.

A seguir estão as etapas para converter Word para HTML:

  1. Crie uma instância da classe Document e carregue o arquivo de origem do Word.
  2. Inicialize um objeto da classe HtmlSaveOptions para especificar opções adicionais ao salvar um documento nos formatos HTML.
  3. Invoque setExportRoundtripInformation para especificar se deseja gravar as informações de ida e volta ao salvar em HTML.
  4. Se o valor do método setExportFontResources for verdadeiro, os recursos de fonte serão exportados para HTML.
  5. Chame o método setExportFontsAsBase64 para especificar se os recursos de fonte devem ser incorporados em HTML na codificação Base64.
  6. Agora, o método save salvará o documento do Word no formato HTML.

Copie e cole o seguinte código em seu arquivo principal:

// Crie uma instância da classe Document e carregue o arquivo de origem do Word. 
Document doc = new Document(  "sample.doc");
// Inicialize um objeto da classe HtmlSaveOptions para especificar opções adicionais ao salvar um documento nos formatos HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Invoque setExportRoundtripInformation para especificar se deseja gravar as informações de ida e volta ao salvar em HTML.
options.setExportRoundtripInformation(true);
// Se o valor do método setExportFontResources for verdadeiro, os recursos de fonte serão exportados para HTML.
options.setExportFontResources(true);
// Chame o método setExportFontsAsBase64 para especificar se os recursos de fontes devem ser incorporados ao HTML na codificação Base64.
options.setExportFontsAsBase64(true);
// Agora, o método save salvará o documento do Word no formato HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

A saída pode ser vista na imagem abaixo:

palavra para html

Obtenha uma licença gratuita

Você pode obter uma licença temporária gratuita para experimentar a API sem limitações de avaliação.

Resumindo

Podemos encerrar este post aqui. Esperamos que você tenha gostado do artigo e aprendido como converter Word para HTML em Java programaticamente. Existem muitos outros recursos expostos por esta biblioteca Java Word, então não se esqueça de visitar a documentação.

Além disso, sugerimos que você siga nosso Guia de primeiros passos.

Finalmente, conholdate.com está escrevendo novas postagens no blog. Então, por favor, fique em contato para atualizações regulares.

Faça uma pergunta

Você pode nos informar sobre suas perguntas ou dúvidas em nosso fórum.

perguntas frequentes

Como faço para converter um DOCX para HTML?

Crie uma instância da classe Document e carregue o arquivo do Word de origem e chame o método save para salvar o arquivo do Word no formato HTML.

Veja também