Converter HTML para Word usando Java

Converter HTML para Word usando Java

Esta postagem do blog ensinará como converter HTML para Word usando Java programaticamente. Felizmente, esta biblioteca Java oferece processamento, manipulação e conversões instantâneas de arquivos. Você pode instalar esta biblioteca facilmente sem dependências externas. Além disso, há documentação abrangente disponível sobre sua instalação e uso. Os documentos do Microsoft Word são os formatos de arquivo mais usados atualmente. Portanto, vamos demonstrar passo a passo o processo de conversão de HTML para Word.

Abordaremos os seguintes pontos:

Converter HTML para Word usando Java - instalação da API

Esta biblioteca Java DOCX fornece uma enorme pilha de recursos que impulsionam os processos de conversão de arquivos. Ele lhe dá controle sobre tarefas de manipulação de dados e arquivos. Para habilitar esta biblioteca em seu aplicativo Java, download os arquivos jar ou você pode seguir as seguintes configurações do Maven.

Repositório

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dependência

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Como converter página da Web para Word programaticamente

Converter uma página HTML em um documento do Word programaticamente é super simples. Você pode obter essa funcionalidade seguindo algumas etapas mencionadas abaixo.

  1. Crie uma instância da classe Document e carregue um arquivo HTML de origem.
  2. Chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX.

Copie e cole o código a seguir em seu arquivo Java para converter o arquivo HTML em arquivo do Word.

// crie uma instância da classe Document e carregue um arquivo HTML de origem
Document document = new Document("index.html");
// chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX
document.save("output.docx", SaveFormat.DOCX);

Biblioteca conversora de HTML para Word - Recursos avançados

Nesta seção, exploraremos os recursos avançados, como definir a qualidade do documento, configurar uma senha e muito mais.

Você pode seguir as etapas a seguir e os snippets de código para conhecer outros métodos:

  1. Crie uma instância da classe Document e carregue um arquivo HTML de origem.
  2. O método protect(int type, java.lang.String password) permitirá que você defina uma senha para proteger o documento de quaisquer alterações.
  3. unprotect() removerá a senha.
  4. Defina este método setTrackRevisions True se as alterações forem rastreadas quando este documento for editado no Microsoft Word.
  5. Erros de ortografia serão destacados se o método setShowSpellingErrors for True.
  6. setShowGramaticalErrors destacará os erros gramaticais se True.
  7. removeAllChildren remove todos os nós filhos do nó atual.
  8. Instancie uma instância da classe DocSaveOptions.
  9. Invoque o método setUseHighQualityRendering para definir um valor que determina se deve ou não usar algoritmos de renderização de alta qualidade (ou seja, lentos).
  10. Chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX.
        // crie uma instância da classe Document e carregue um arquivo HTML de origem
        Document document = new Document("index.html");
        // O método protect(int type, java.lang.String password) permitirá que você defina uma senha para proteger o documento de quaisquer alterações
        document.protect(1,"password");
        // unprotect() irá remover a senha
        document.unprotect();
        // defina este método setTrackRevisions True se as alterações forem rastreadas quando este documento for editado no Microsoft Word.
        document.setTrackRevisions(true);
        // erros de ortografia serão destacados se o método setShowSpellingErrors for True
        document.setShowSpellingErrors(true);
        // O método setShowGramaticalErrors destacará os erros gramaticais se True
        document.setShowGrammaticalErrors(true);
        // removeAllChildren remove todos os nós filho do nó atual.
        document.removeAllChildren();
        // instanciar uma instância da classe DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // invoque o método setUseHighQualityRendering para definir um valor que determina se deve ou não usar algoritmos de renderização de alta qualidade (ou seja, lentos).
        opt.setUseHighQualityRendering(true);
        // chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX
        document.save("output.docx", SaveFormat.DOCX);

Obtenha uma licença gratuita

Você pode obter uma licença temporária gratuita para experimentar a API sem limitações de avaliação.

Resumindo

Isso nos leva ao final desta postagem no blog. Cobrimos como converter HTML para Word usando Java programaticamente. Além disso, você pode encontrar os trechos de código da funcionalidade mencionada nas seções acima. Além disso, você pode visitar a documentação para outros recursos que podem ser benéficos para o seu conversor de HTML para Word. Finalmente, conholdate.com está escrevendo novas postagens no blog sobre outros tópicos. Portanto, por favor, fique em contato para atualizações regulares.

Faça uma pergunta

Você pode compartilhar suas perguntas ou dúvidas em nosso fórum.

Veja também