Convertir PDF a HTML usando Java

PDF ofrece compartir e imprimir documentos de solo lectura sin perder el formato de los documentos. Podemos convertir fácilmente documentos PDF a páginas web HTML y verlos en cualquier navegador. En este artículo, aprenderemos cómo convertir documentos PDF a páginas web HTML usando Java.

En este artículo se tratarán los siguientes temas:

API de Java para convertir PDF a HTML — Descarga gratuita

Para convertir PDF a HTML, utilizaremos la API GroupDocs.Conversion for Java. Proporciona soluciones de conversión de archivos rápidas, eficientes y confiables para los usuarios finales. Descargue el JAR de la API o simplemente agregue la siguiente configuración pom.xml en una aplicación Java basada en Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Conversión de PDF a HTML usando Java

Podemos convertir fácilmente documentos PDF a páginas web HTML mediante programación siguiendo los sencillos pasos que se indican a continuación:

  1. En primer lugar, cargue un documento PDF usando la clase Converter.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions.
  3. Luego, opcionalmente configure varias opciones de conversión como FixedLayout, FixedLayoutShowBorders, etc.
  4. Finalmente, convierta PDF a HTML usando el método Converter.Convert(). Toma la ruta del archivo de salida y las opciones de conversión como argumentos.

El siguiente ejemplo de código muestra cómo convertir un documento PDF en una página web HTML usando Java.

// Este ejemplo de código demuestra cómo convertir un documento PDF a un archivo HTML.
// Inicializar objeto de clase Convertirir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Definir opciones de conversión
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setFixedLayout(true);

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Conversión de PDF a HTML usando Java

Conversión de PDF a HTML usando Java.

Convertir rango de páginas de PDF a HTML

Podemos convertir un rango de páginas de un documento PDF a HTML siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF usando la clase Converter.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions.
  3. Luego, establezca el número de página para iniciar la conversión.
  4. Después de eso, configure el recuento de páginas para convertir el número total de páginas.
  5. Finalmente, convierta PDF a HTML usando el método Converter.Convert().

El siguiente ejemplo de código muestra cómo convertir un rango de páginas de un documento PDF a un archivo HTML usando Java.

// Este ejemplo de código demuestra cómo convertir un rango de páginas PDF a un archivo HTML.
// Inicializar objeto de clase Convertirir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Definir opciones de conversión
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Convertir páginas específicas de PDF a HTML

Podemos convertir páginas específicas de un documento PDF a HTML siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF usando la clase Converter.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions.
  3. Luego, proporcione números de página específicos en una lista separada por comas para convertir.
  4. Finalmente, convierta PDF a HTML usando el método Converter.Convert().

El siguiente ejemplo de código muestra cómo convertir páginas específicas de un documento PDF a un archivo HTML usando Java.

// Este ejemplo de código demuestra cómo convertir páginas específicas de un documento PDF a un archivo HTML.
// Inicializar objeto de clase Convertirir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Definir opciones de conversión
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Convierta PDF protegido por contraseña a HTML en Java

También podemos convertir documentos PDF protegidos con contraseña a páginas web HTML siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, proporcione la contraseña mediante el objeto de clase PdfLoadOptions.
  2. A continuación, cargue un documento PDF usando la clase Converter con PdfLoadOptions.
  3. Luego, cree una instancia de la clase MarkupConvertOptions.
  4. Finalmente, convierta PDF a HTML usando el método Converter.Convert().

El siguiente ejemplo de código muestra cómo convertir un documento PDF protegido con contraseña en un documento HTML usando Java.

// Este ejemplo de código demuestra cómo convertir PDF protegido con contraseña a HTML.
// Definir opciones de carga
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Inicializar objeto de clase Convertirir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Definir opciones de conversión
MarkupConvertirOptions options = new MarkupConvertirOptions();

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Conversión de PDF a HTML con marca de agua en Java

Podemos convertir documentos PDF a páginas web HTML y agregar marcas de agua a archivos HTML convertidos siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF usando la clase Converter.
  2. A continuación, cree una instancia de la clase WatermarkOptions.
  3. Luego, configure varias opciones como Texto, Color, Ancho, Alto, Fuente, etc.
  4. A continuación, cree una instancia de la clase MarkupConvertOptions.
  5. Después de eso, asigne WatermarkOptions a MarkupConvertOptions.
  6. Finalmente, convierta PDF a HTML usando el método Converter.Convert().

El siguiente ejemplo de código muestra cómo convertir un documento PDF en un documento HTML con una marca de agua.

// Este ejemplo de código demuestra cómo convertir un PDF a HTML con marca de agua.
// Inicializar objeto de clase Convertirir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Definir marca de agua 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Definir opciones de conversión
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setWatermark(watermark);

// Ruta del archivo de salida
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Convertir
converter.convert(outputFile, options);
Conversión de PDF a HTML con marca de agua en Java

Conversión de PDF a HTML con marca de agua en Java.

Obtenga una licencia gratis

Pruebe la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, hemos aprendido cómo convertir documentos PDF a páginas web HTML en Java. También hemos visto cómo convertir un archivo PDF protegido con contraseña a HTML y agregar una marca de agua al archivo convertido mediante programación. Además, puede obtener más información sobre GroupDocs.Conversion for Java API utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también