Convertir PDF en HTML en utilisant Java

PDF propose de partager et d’imprimer des documents en lecture seule sans perdre la mise en forme des documents. Nous pouvons facilement convertir des documents PDF en pages Web HTML et les afficher dans n’importe quel navigateur. Dans cet article, nous allons apprendre comment convertir des documents PDF en pages Web HTML à l’aide de Java. Les sujets suivants seront traités dans cet article:

API Java pour convertir PDF en HTML — Téléchargement gratuit

Pour convertir le PDF en HTML, nous utiliserons l’API GroupDocs.Conversion for Java. Il fournit des solutions de conversion de fichiers rapides, efficaces et fiables aux utilisateurs finaux. Veuillez soit télécharger le JAR de l’API ou simplement ajouter la configuration pom.xml suivante dans une application Java basée sur Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Conversion PDF en HTML avec Java

Nous pouvons facilement convertir des documents PDF en pages Web HTML par programmation en suivant les étapes simples indiquées ci-dessous:

  1. Tout d’abord, chargez un document PDF à l’aide de la classe Converter.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions.
  3. Ensuite, définissez éventuellement diverses options de conversion telles que FixedLayout, FixedLayoutShowBorders, etc.
  4. Enfin, convertissez PDF en HTML en utilisant la Converter.Convert() method. Il prend le chemin du fichier de sortie et convertit les options en arguments.

L’exemple de code suivant montre comment convertir un document PDF en une page Web HTML à l’aide de Java.

// Cet exemple de code montre comment convertir un document PDF en fichier HTML.
// Initialiser l'objet de classe Convertir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Définir les options de conversion
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setFixedLayout(true);

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Conversion PDF en HTML avec Java

Conversion PDF en HTML en utilisant Java.

Convertir une plage de pages de PDF en HTML

Nous pouvons convertir une plage de pages d’un document PDF en HTML en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF à l’aide de la classe Converter.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions.
  3. Ensuite, définissez le numéro de page à partir duquel commencer la conversion.
  4. Après cela, définissez le nombre de pages pour convertir le nombre total de pages.
  5. Enfin, convertissez PDF en HTML en utilisant la Converter.Convert() method.

L’exemple de code suivant montre comment convertir une plage de pages d’un document PDF en un fichier HTML à l’aide de Java.

// Cet exemple de code montre comment convertir une plage de pages PDF en fichier HTML.
// Initialiser l'objet de classe Convertir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Définir les options de conversion
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Convertir des pages spécifiques de PDF en HTML

Nous pouvons convertir des pages spécifiques d’un document PDF en HTML en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF à l’aide de la classe Converter.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions.
  3. Ensuite, fournissez des numéros de page spécifiques dans une liste séparée par des virgules à convertir.
  4. Enfin, convertissez PDF en HTML en utilisant la Converter.Convert() method.

L’exemple de code suivant montre comment convertir des pages spécifiques d’un document PDF en un fichier HTML à l’aide de Java.

// Cet exemple de code montre comment convertir des pages spécifiques d'un document PDF en fichier HTML.
// Initialiser l'objet de classe Convertir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Définir les options de conversion
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Convertir un PDF protégé par mot de passe en HTML en Java

Nous pouvons également convertir des documents PDF protégés par mot de passe en pages Web HTML en suivant les étapes ci-dessous:

  1. Tout d’abord, fournissez un mot de passe à l’aide de l’objet PdfLoadOptions class.
  2. Ensuite, chargez un document PDF en utilisant la classe Converter avec PdfLoadOptions.
  3. Créez ensuite une instance de la classe MarkupConvertOptions.
  4. Enfin, convertissez PDF en HTML en utilisant la Converter.Convert() method.

L’exemple de code suivant montre comment convertir un document PDF protégé par mot de passe en document HTML à l’aide de Java.

// Cet exemple de code montre comment convertir un PDF protégé par mot de passe en HTML.
// Définir les options de chargement
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Initialiser l'objet de classe Convertir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Définir les options de conversion
MarkupConvertirOptions options = new MarkupConvertirOptions();

// Convertir
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Conversion PDF en HTML avec filigrane en Java

Nous pouvons convertir des documents PDF en pages Web HTML et ajouter des filigranes aux fichiers HTML convertis en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF à l’aide de la classe Converter.
  2. Ensuite, créez une instance de la classe WatermarkOptions.
  3. Ensuite, définissez diverses options telles que Text, Color, Width, Height, Font, etc.
  4. Ensuite, créez une instance de la classe MarkupConvertOptions.
  5. Après cela, attribuez WatermarkOptions à MarkupConvertOptions.
  6. Enfin, convertissez PDF en HTML en utilisant la Converter.Convert() method.

L’exemple de code suivant montre comment convertir un document PDF en un document HTML avec un filigrane.

// Cet exemple de code montre comment convertir un PDF en HTML avec filigrane.
// Initialiser l'objet de classe Convertir
Convertirer converter = new Convertirer("C:\\Files\\Conversion\\sample.pdf");

// Définir le filigrane 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Définir les options de conversion
MarkupConvertirOptions options = new MarkupConvertirOptions();
options.setWatermark(watermark);

// Chemin du fichier de sortie
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Convertir
converter.convert(outputFile, options);
Conversion PDF en HTML avec filigrane en Java

Conversion PDF en HTML avec filigrane en Java.

Obtenez une licence gratuite

Veuillez essayer l’API sans limitation d’évaluation en demandant une licence temporaire gratuite.

Conclusion

Dans cet article, nous avons appris comment convertir des documents PDF en pages Web HTML en Java. Nous avons également vu comment convertir un fichier PDF protégé par mot de passe en HTML et ajouter un filigrane au fichier converti par programmation. En outre, vous pouvez en savoir plus sur l’API GroupDocs.Conversion pour Java en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également