Editar Word DOCX usando Java

Puede editar mediante programación todos los formatos de documentos de procesamiento de texto como DOC, DOCX o DOTM fácilmente. Como desarrollador de Java, puede editar documentos de Word en sus aplicaciones Java. En este artículo, aprenderá cómo editar documentos de Word usando Java.

Los siguientes temas se discuten/tratan en este artículo:

API de Java para editar documentos de Word

Para editar archivos DOCX, utilizaré la API GroupDocs.Editor for Java. Le permite editar mediante programación documentos de procesamiento de Word, hojas de Excel o documentos de otros formatos admitidos. La API le permite cargar documentos y convertirlos a HTML. Proporciona HTML a la interfaz de usuario externa para editar y luego guardar HTML en el documento original después de la manipulación.

Puede descargar el JAR de la API o simplemente agregar la siguiente configuración pom.xml en sus aplicaciones Java basadas en Maven para probar los ejemplos de código que se mencionan a continuación.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11.0</version> 
</dependency>

Editar documentos de Word usando Java

Puede editar fácilmente documentos de Word mediante programación siguiendo los sencillos pasos que se mencionan a continuación:

El siguiente ejemplo de código muestra cómo editar archivos DOCX usando Java.

//Fichero de entrada
String inputFilePath = "C:\\Files\\Sample.docx";

//Cargue el documento con opciones de carga
WordProcessingLoadOptions wordLoadOptions = new WordProcessingLoadOptions();
wordLoadOptions.setPassword("some password"); // Password if required
Editor editor = new Editor(inputFilePath, wordLoadOptions);

// Especificar opciones de edición
WordProcessingEditOptions editOptions = new WordProcessingEditOptions();
editOptions.setEnableLanguageInformation(true);
editOptions.setEnablePagination(true);

//Abrir documento de entrada para editar
EditableDocument beforeEdit = editor.edit(editOptions);

//Obtenga el contenido del documento y los recursos asociados del documento editable
String content = beforeEdit.getContent();
List<IImageResource> images = beforeEdit.getImages();
List<FontResourceBase> fonts = beforeEdit.getFonts();
List<CssText> stylesheets = beforeEdit.getCss();

//Obtenga el documento como una sola cadena codificada en base64, donde todos los recursos (imágenes, fuentes, etc.) están incrustados dentro de esta cadena junto con el contenido textual principal
String allEmbeddedInsideString = beforeEdit.getEmbeddedHtml();
//Editar el contenido
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("Subtitle", "Edited subtitle");

//Cree una nueva instancia de EditableDocument a partir de contenido y recursos editados
EditableDocument afterEdit = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);

//ruta del documento de salida
String outputPath = "C:\\Files\\Sample_output.docx";
//Guardar opciones
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
//Finalmente, guarde en la ruta
editor.save(afterEdit, outputPath, saveOptions);

//Deseche los objetos
beforeEdit.dispose();
afterEdit.dispose();
editor.dispose();
Editar documentos de Word usando Java

Editar documentos de Word usando Java

La clase WordprocessingLoadOptions proporciona varias opciones para cargar documentos de Word como DOC, DOCX, RTF, ODT, etc. en la clase Editor.

  • El método setPassword permite especificar la contraseña para abrir los documentos protegidos por contraseña.

La clase Editor es la clase principal que proporciona métodos para cargar, editar y guardar documentos de todos los formatos compatibles.

La clase WordProcesingEditOptions le permite especificar opciones personalizadas para abrir los documentos de procesamiento de texto para editar.

  • El método setEnabledLanguageInformation especifica si la información del idioma se exporta al marcado HTML en forma de atributos HTML ’lang'.
  • El método setEnablePagination permite habilitar o deshabilitar la paginación en el documento HTML resultante.

La clase EditableDocument almacena internamente el documento y proporciona métodos para generar marcado HTML y producir recursos.

La clase WordProcessingSaveOptions proporciona opciones personalizadas para generar y guardar documentos de Word después de editarlos.

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a editar documentos de Word usando Java. Puede obtener más información sobre GroupDocs.Editor para la API de Java utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también