Convert PDF to Word using Java

Puede convertir fácilmente sus documentos PDF en documentos de Word (.docx o .doc) mediante programación en sus aplicaciones Java. Dicha conversión es útil cuando necesita editar el texto de sus documentos PDF o puede necesitar aplicar el formato de texto. En este artículo, aprenderá cómo convertir PDF a Word usando Java.

Los siguientes temas se discuten/tratan en este artículo:

API de Java para convertir PDF a Word

Usaré GroupDocs.Conversion for Java API para la conversión de PDF a DOCX. Esta API proporciona una solución de conversión de archivos rápida, eficiente y confiable en aplicaciones Java sin instalar ningún software externo. Admite conversiones entre todos los formatos de documentos comerciales populares, como PDF, HTML, correo electrónico, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, formatos de archivo de imagen de trama y muchos más. También le permite mostrar el documento completo o renderizarlo parcialmente para acelerar el proceso. La API es compatible con todas las versiones de Java y es compatible con los sistemas operativos populares (Windows, Linux, macOS) que pueden ejecutar el tiempo de ejecución de Java.

Descargar y configurar

Puede descargar el JAR de la API o simplemente agregar la siguiente configuración pom.xml en su aplicación Java basada en Maven para probar los ejemplos de código mencionados a continuación.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Convertir PDF a Word usando Java

Puede convertir documentos PDF a Word siguiendo los sencillos pasos que se indican a continuación:

  1. Crear una instancia de la clase Convertidor
  2. Proporcione la ruta del archivo de entrada
  3. Crear una instancia de WordProcessingConvertOptions
  4. Establecer el número de la página de inicio
  5. Proporcione el total de páginas para convertir
  6. Establecer formato de archivo de salida
  7. Llame al método Convert() junto con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir un archivo PDF en un documento de Word usando Java.

// crear convertiridor
Converter convertirer = new Converter("C:\\Files\\sample.pdf");

// establecer opciones de conversión de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);
Convertir PDF a Word usando Java

Convertir PDF a Word usando Java

La clase Convertidor es la clase principal que controla el proceso de conversión de documentos. Proporciona varios métodos para convertir documentos de formatos de archivo compatibles. El método Convert() de esta clase convierte documentos de origen y toma dos parámetros de entrada, la ruta del archivo al documento de origen y ConvertOptions para convertir un documento de origen específico al tipo de archivo de destino deseado.

La clase WordProcessingConvertOptions proporciona opciones para la conversión al tipo de archivo WordProcessing. El método setPageNumber() permite configurar el número de página inicial para iniciar la conversión. Mientras que el método setPagesCount() define el número total de páginas que se convertirán a partir del número de página definido. El método setFormat() de esta clase le permite establecer el formato de salida del documento convertido. Toma el tipo de enumeración WordProcessingFileType como entrada.

Convertir páginas específicas de PDF a Word

Puede convertir páginas específicas de un documento PDF a Word siguiendo los sencillos pasos que se indican a continuación:

  1. Crear una instancia de la clase Convertidor
  2. Proporcione la ruta del archivo de entrada
  3. Crear una instancia de WordProcessingConvertOptions
  4. Establecer la lista de números de página para convertir
  5. Llame al método Convert() junto con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir páginas específicas de un archivo PDF en un documento de Word usando Java.

// crear convertiridor
Converter convertirer = new Converter("C:\\Files\\sample.pdf");

// definir las opciones de conversión de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);

La clase WordProcessingConvertOptions proporciona el método setPages() para convertir números de página específicos definidos en una lista separada por comas de un documento de origen.

Cargue un PDF protegido con contraseña y conviértalo a Word

Puede convertir documentos PDF protegidos con contraseña a Word siguiendo los sencillos pasos que se detallan a continuación:

  1. Crear PdfLoadOptions
  2. Configurar la clave
  3. Crear una instancia de la clase Convertidor
  4. Proporcione la ruta del archivo de entrada
  5. Crear una instancia de WordProcessingConvertOptions
  6. Llame al método Convert() junto con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir un archivo PDF protegido con contraseña en un documento de Word usando Java.

// Opciones de carga de PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// crear convertiridor
Converter convertirer = new Converter("C:\\Files\\sample.pdf", loadOptions);

// definir las opciones de conversión de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);

La clase PdfLoadOptions proporciona varias opciones para cargar documentos PDF. El método setPassword() de esta clase le permite desproteger el documento protegido proporcionando su contraseña.

Puede encontrar más detalles sobre “Cargar documento PDF con opciones” en la documentación.

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido cómo convertir documentos PDF a Word usando Java. También ha aprendido a convertir un archivo PDF protegido con contraseña en un documento de Word. Además, ha aprendido cómo convertir páginas específicas de un PDF a un documento de Word mediante programación. Puede obtener más información sobre GroupDocs.Conversion Java API utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también