Esta postagem do blog ensinará como converter HTML para Word usando Java programaticamente. Felizmente, esta biblioteca Java oferece processamento, manipulação e conversões instantâneas de arquivos. Você pode instalar esta biblioteca facilmente sem dependências externas. Além disso, há documentação abrangente disponível sobre sua instalação e uso. Os documentos do Microsoft Word são os formatos de arquivo mais usados atualmente. Portanto, vamos demonstrar passo a passo o processo de conversão de HTML para Word.
Abordaremos os seguintes pontos:
- Converter HTML para Word usando Java - instalação da API
- Como converter página da Web para Word programaticamente
- Biblioteca conversora de HTML para Word - Recursos avançados
Converter HTML para Word usando Java - instalação da API
Esta biblioteca Java DOCX fornece uma enorme pilha de recursos que impulsionam os processos de conversão de arquivos. Ele lhe dá controle sobre tarefas de manipulação de dados e arquivos. Para habilitar esta biblioteca em seu aplicativo Java, download os arquivos jar ou você pode seguir as seguintes configurações do Maven.
Repositório
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Dependência
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Como converter página da Web para Word programaticamente
Converter uma página HTML em um documento do Word programaticamente é super simples. Você pode obter essa funcionalidade seguindo algumas etapas mencionadas abaixo.
- Crie uma instância da classe Document e carregue um arquivo HTML de origem.
- Chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX.
Copie e cole o código a seguir em seu arquivo Java para converter o arquivo HTML em arquivo do Word.
// crie uma instância da classe Document e carregue um arquivo HTML de origem
Document document = new Document("index.html");
// chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX
document.save("output.docx", SaveFormat.DOCX);
Biblioteca conversora de HTML para Word - Recursos avançados
Nesta seção, exploraremos os recursos avançados, como definir a qualidade do documento, configurar uma senha e muito mais.
Você pode seguir as etapas a seguir e os snippets de código para conhecer outros métodos:
- Crie uma instância da classe Document e carregue um arquivo HTML de origem.
- O método protect(int type, java.lang.String password) permitirá que você defina uma senha para proteger o documento de quaisquer alterações.
- unprotect() removerá a senha.
- Defina este método setTrackRevisions True se as alterações forem rastreadas quando este documento for editado no Microsoft Word.
- Erros de ortografia serão destacados se o método setShowSpellingErrors for True.
- setShowGramaticalErrors destacará os erros gramaticais se True.
- removeAllChildren remove todos os nós filhos do nó atual.
- Instancie uma instância da classe DocSaveOptions.
- Invoque o método setUseHighQualityRendering para definir um valor que determina se deve ou não usar algoritmos de renderização de alta qualidade (ou seja, lentos).
- Chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX.
// crie uma instância da classe Document e carregue um arquivo HTML de origem
Document document = new Document("index.html");
// O método protect(int type, java.lang.String password) permitirá que você defina uma senha para proteger o documento de quaisquer alterações
document.protect(1,"password");
// unprotect() irá remover a senha
document.unprotect();
// defina este método setTrackRevisions True se as alterações forem rastreadas quando este documento for editado no Microsoft Word.
document.setTrackRevisions(true);
// erros de ortografia serão destacados se o método setShowSpellingErrors for True
document.setShowSpellingErrors(true);
// O método setShowGramaticalErrors destacará os erros gramaticais se True
document.setShowGrammaticalErrors(true);
// removeAllChildren remove todos os nós filho do nó atual.
document.removeAllChildren();
// instanciar uma instância da classe DocSaveOptions
DocSaveOptions opt = new DocSaveOptions();
// invoque o método setUseHighQualityRendering para definir um valor que determina se deve ou não usar algoritmos de renderização de alta qualidade (ou seja, lentos).
opt.setUseHighQualityRendering(true);
// chame o método save(java.lang.String fileName, int saveFormat) para salvar o arquivo no formato DOCX
document.save("output.docx", SaveFormat.DOCX);
Obtenha uma licença gratuita
Você pode obter uma licença temporária gratuita para experimentar a API sem limitações de avaliação.
Resumindo
Isso nos leva ao final desta postagem no blog. Cobrimos como converter HTML para Word usando Java programaticamente. Além disso, você pode encontrar os trechos de código da funcionalidade mencionada nas seções acima. Além disso, você pode visitar a documentação para outros recursos que podem ser benéficos para o seu conversor de HTML para Word. Finalmente, conholdate.com está escrevendo novas postagens no blog sobre outros tópicos. Portanto, por favor, fique em contato para atualizações regulares.
Faça uma pergunta
Você pode compartilhar suas perguntas ou dúvidas em nosso fórum.