Editar Word DOCX usando Java

Você pode editar programaticamente todos os formatos de documentos de processamento de texto como DOC, DOCX ou DOTM facilmente. Como desenvolvedor Java, você pode editar documentos do Word em seus aplicativos Java. Neste artigo, você aprenderá como editar documentos do Word usando Java.

Os seguintes tópicos são discutidos/abordados neste artigo:

API Java para edição de documentos do Word

Para editar arquivos DOCX, estarei usando a API GroupDocs.Editor for Java. Ele permite que você edite de forma programática documentos de processamento de texto, planilhas do Excel ou documentos de outros formatos suportados. A API permite carregar documentos e convertê-los em HTML. Ele fornece HTML para UI externa para edição e, em seguida, salva o HTML no documento original após a manipulação.

Você pode baixar o JAR da API ou apenas adicionar a seguinte configuração pom.xml em seus aplicativos Java baseados em Maven para experimentar os exemplos de código mencionados abaixo.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11.0</version> 
</dependency>

Editar documentos do Word usando Java

Você pode editar facilmente documentos do Word programaticamente seguindo as etapas simples mencionadas abaixo:

O exemplo de código a seguir mostra como editar arquivos DOCX usando Java.

//Arquivo de entrada
String inputFilePath = "C:\\Files\\Sample.docx";

//Carregar o documento com opções de carregamento
WordProcessingLoadOptions wordLoadOptions = new WordProcessingLoadOptions();
wordLoadOptions.setPassword("some password"); // Password if required
Editor editor = new Editor(inputFilePath, wordLoadOptions);

// Especificar opções de edição
WordProcessingEditOptions editOptions = new WordProcessingEditOptions();
editOptions.setEnableLanguageInformation(true);
editOptions.setEnablePagination(true);

//Abra o documento de entrada para editar
EditableDocument beforeEdit = editor.edit(editOptions);

//Pegue o conteúdo do documento e os recursos associados do documento editável
String content = beforeEdit.getContent();
List<IImageResource> images = beforeEdit.getImages();
List<FontResourceBase> fonts = beforeEdit.getFonts();
List<CssText> stylesheets = beforeEdit.getCss();

//Obtenha o documento como uma única String codificada em base64, onde todos os recursos (imagens, fontes, etc) são incorporados dentro desta String junto com o conteúdo textual principal
String allEmbeddedInsideString = beforeEdit.getEmbeddedHtml();
//Edite o conteúdo
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("Subtitle", "Edited subtitle");

//Criar uma nova instância EditableDocument a partir de conteúdo e recursos editados
EditableDocument afterEdit = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);

//caminho do documento de saída
String outputPath = "C:\\Files\\Sample_output.docx";
//Salvar opções
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
//Por fim, salve no caminho
editor.save(afterEdit, outputPath, saveOptions);

//Descarte os objetos
beforeEdit.dispose();
afterEdit.dispose();
editor.dispose();
Editar documentos do Word usando Java

Editar documentos do Word usando Java

A classe WordprocessingLoadOptions fornece várias opções para carregar documentos do Word como DOC, DOCX, RTF, ODT, etc. na classe Editor.

  • O método setPassword permite especificar a senha para abrir os documentos protegidos por senha.

A classe Editor é a classe principal que fornece métodos para carregar, editar e salvar documentos de todos os formatos compatíveis.

A classe WordProcesingEditOptions permite especificar opções personalizadas para abrir os documentos de processamento de texto a serem editados.

  • O método setEnabledLanguageInformation especifica se as informações de idioma são exportadas para a marcação HTML em um formato de atributos HTML ’lang'.
  • O método setEnablePagination permite habilitar ou desabilitar a paginação no documento HTML resultante.

A classe EditableDocument armazena internamente o documento e fornece métodos para gerar marcação HTML e produzir recursos.

A classe WordProcessingSaveOptions fornece opções personalizadas para gerar e salvar documentos do Word após a edição.

Obtenha uma licença gratuita

Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como editar documentos do Word usando Java. Você pode aprender mais sobre GroupDocs.Editor para API Java usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.

Veja também