Convertir HTML a PDF usando Java

Como desarrollador de Java, puede convertir fácilmente archivos HTML o páginas web desde URL web en vivo en documentos PDF mediante programación en sus aplicaciones Java. En este artículo, aprenderá cómo convertir HTML a PDF usando Java.

Los siguientes temas se discuten/tratan en este artículo:

API Java de conversión de HTML a PDF

Para convertir HTML a PDF, usaré GroupDocs.Conversion for Java API. Es una solución de conversión de archivos rápida, eficiente y confiable para sus aplicaciones Java sin instalar ningún software externo. Puede convertir entre todos los formatos de documentos comerciales populares, como PDF, HTML, correo electrónico, Word, Excel, PowerPoint, Project, formatos de archivo de imagen de trama y muchos más. También le permite mostrar el documento completo o renderizarlo parcialmente para acelerar el proceso. La API es compatible con todas las versiones de Java y es compatible con los sistemas operativos populares (Windows, Linux, macOS) que pueden ejecutar el tiempo de ejecución de Java.

Puede descargar el JAR de la API o simplemente agregar la siguiente configuración pom.xml en su aplicación Java basada en Maven para probar los ejemplos de código que se mencionan a continuación.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
  <groupId>com.groupdocs</groupId>
  <artifactId>groupdocs-conversion</artifactId>
  <version>21.7</version> 
</dependency>

Convertir HTML a PDF usando Java

Puede convertir fácilmente archivos HTML a documentos PDF siguiendo los sencillos pasos que se detallan a continuación:

  1. Cree una instancia de la clase Converter con la ruta del archivo de entrada
  2. Cree una instancia de PdfConvertOptions
  3. Llame al método convert() con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir un documento HTML en un documento PDF usando Java.

// inicializar convertiridor
Converter convertirer = new Converter("C:\\Files\\sample.html");

// definir las opciones de conversión de PDF
PdfConvertOptions options = new PdfConvertOptions();

// convertir
convertirer.convertir("C:\\Files\\HtmlToPdf.pdf", options);
Convertir HTML a PDF usando Java

Convertir HTML a PDF usando Java

La clase Convertidor es la clase principal que controla el proceso de conversión de documentos. Proporciona varios métodos para cumplir con las solicitudes de conversión. El método convert() de esta clase convierte el documento de origen al formato de destino especificado y guarda el documento convertido en la ruta de archivo dada. Proporciona varios métodos convert() sobrecargados para convertir formatos de archivo compatibles.

Convierta HTML a PDF con opciones avanzadas

Puede usar algunas configuraciones avanzadas al convertir los archivos HTML a documentos PDF siguiendo los pasos que se detallan a continuación:

  1. Cree una instancia de la clase Converter con la ruta del archivo de entrada
  2. Crear una instancia de PdfConvertOptions
  3. Establezca varias opciones como Rotación, Dpi, Ancho, Alto, etc.
  4. Llame al método convert() con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir un archivo HTML en un documento PDF con configuraciones avanzadas.

// inicializar convertiridor
Converter convertirer = new Converter("C:\\Files\\sample.html");

// definir PdfConvertOptions
PdfConvertOptions options = new PdfConvertOptions();
options.setPassword("12345");
options.setRotate(Rotation.On180);
options.setDpi(300);
options.setWidth(1024);
options.setHeight(768);

// convertir
convertirer.convertir("C:\\Files\\ConvertWithAdvancedOptions.pdf", options);
Convierta HTML a PDF con opciones avanzadas usando Java

Convierta HTML a PDF con opciones avanzadas usando Java

La clase PdfConvertOptions ofrece varias opciones para convertir archivos de entrada específicos en documentos PDF. He usado las siguientes opciones:

  • Ancho — the setWidth() property sets the image width after conversion
  • Altura — the setHeight() property sets the desired image height after conversion
  • ppp — the setDpi() property sets the desired page DPI after conversion
  • Clave — the setPassword() property protects the converted document with a password
  • Girar — the setRotate() property allows page rotation with the following available options: None, On90, On180, On270

Puede encontrar más detalles sobre “Convertir a PDF con opciones avanzadas” en la documentación.

Conversión de HTML a PDF desde una URL

Puede convertir las páginas web HTML de las URL en vivo a los documentos PDF siguiendo los pasos que se detallan a continuación:

  1. Proporcione la URL a un objeto de flujo de entrada y abra el flujo
  2. Cree una instancia de la clase Converter con el objeto de flujo de entrada
  3. Cree una instancia de PdfConvertOptions
  4. Llame al método convert() con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir HTML de una URL web a un documento PDF usando Java.

// flujo de entrada
InputStream stream = new URL("https://onlinebooks.library.upenn.edu/readers.html").openStream();

// inicializar convertiridor
Converter convertirer = new Converter(stream);

// definir las opciones de conversión de PDF
PdfConvertOptions options = new PdfConvertOptions();

// convertir
convertirer.convertir("C:\\Files\\LoadDocumentFromUrl.pdf", options);

Convierta un rango de página específico de HTML a PDF

Puede convertir páginas específicas de documentos HTML de varias páginas a documentos PDF siguiendo los pasos que se indican a continuación:

  1. Cree una instancia de la clase Converter con la ruta del archivo de entrada
  2. Crear una instancia de PdfConvertOptions
  3. Establecer el número de página para iniciar la conversión desde
  4. Establezca el recuento de páginas para convertir el número total de páginas
  5. Llame al método convert() con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir páginas específicas de HTML a un documento PDF usando Java.

// inicializar convertiridor
Converter convertirer = new Converter("C:\\Files\\Conversion\\sample_2.html");

// definir PdfConvertOptions
PdfConvertOptions options = new PdfConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);

// convertir
convertirer.convertir("C:\\Files\\ConvertNConsecutivePages.pdf", options);

Convierta HTML a PDF y agregue una marca de agua

Puede convertir archivos HTML en documentos PDF con marca de agua siguiendo los pasos que se indican a continuación:

  1. Crear una instancia de la clase Convertidor
  2. Proporcione la ruta del archivo de entrada al constructor
  3. Cree una instancia de PdfConvertOptions
  4. Cree una instancia de WatermarkOptions
  5. Establezca varias opciones, como Texto, Color, Ancho, Alto, Ángulo de rotación, etc.
  6. Llame al método convert() con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo convertir un documento HTML en un documento PDF con marca de agua mediante Java.

// inicializar convertiridor
Converter convertirer = new Converter("C:\\Files\\sample_2.html");

// definir las opciones de conversión de PDF
PdfConvertOptions options = new PdfConvertOptions();

// definir opciones de marca de agua
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("THIS IS A SAMPLE TEXT WATERMARK");
watermark.setColor(Color.red);
watermark.setTop(400);
watermark.setLeft(150);
watermark.getWatermarkFont().setBold(true);
watermark.setRotationAngle(30);
watermark.setWidth(1000);
watermark.setHeight(1000);
watermark.setBackground(false);
options.setWatermark(watermark);

// convertir
convertirer.convertir("C:\\Files\\HtmlToPDFAddWatermark.pdf", options);
Convierta HTML a PDF y agregue una marca de agua usando Java

Convierta HTML a PDF y agregue una marca de agua usando Java

La clase WatermarkOptions proporciona varias opciones para agregar una marca de agua a los documentos convertidos. Le permite agregar marcas de agua de texto o imagen a los documentos convertidos.

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido cómo convertir documentos HTML a PDF utilizando Java. También aprendió cómo agregar marcas de agua a los documentos PDF convertidos. Además, ha aprendido cómo convertir HTML utilizando opciones avanzadas de conversión de PDF mediante programación. Este artículo también explicó cómo convertir páginas web HTML de una URL activa a un documento PDF usando Java. Puede obtener más información sobre GroupDocs.Conversion Java API utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también