Convertir PDF en HTML en utilisant C#

PDF est le format le plus répandu pour partager et imprimer des documents. Dans certains cas, nous pouvons être amenés à convertir des documents PDF en pages Web HTML. Une telle conversion permet de partager le contenu des documents PDF afin que les parties prenantes concernées puissent les visualiser facilement dans n’importe quel navigateur. Dans cet article, nous allons apprendre comment convertir des documents PDF en pages Web HTML à l’aide de C#.

Les sujets suivants seront traités dans cet article:

API C# pour convertir PDF en HTML — Téléchargement gratuit

Nous utiliserons l’API GroupDocs.Conversion pour .NET pour convertir le PDF en HTML. Il fournit des solutions de conversion de fichiers rapides, efficaces et fiables aux utilisateurs finaux. Veuillez soit télécharger la DLL de l’API ou l’installer à l’aide de NuGet.

Install-Package GroupDocs.Conversion

Conversion PDF en HTML avec C#

Nous pouvons facilement convertir des documents PDF en pages Web HTML par programmation en suivant les étapes simples indiquées ci-dessous:

  1. Tout d’abord, chargez un document PDF en utilisant la classe Converter avec le chemin du fichier d’entrée comme argument. C’est la classe principale qui contrôle le processus de conversion des documents.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions. Il fournit diverses options de conversion en types de fichiers de balisage.
  3. Ensuite, définissez éventuellement diverses options de conversion telles que FixedLayout, FixedLayoutShowBorders, etc.
  4. Enfin, appelez la Converter.Convert() method pour enregistrer le fichier HTML converti. Cette méthode prend le chemin du fichier de sortie et convertit les options en argument.

L’exemple de code suivant montre comment convertir un document PDF en une page Web HTML à l’aide de C#.

// Charger le fichier PDF source
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Définir les options de conversion pour le format HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Convertir au format HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Convertir PDF en HTML en C#.

Convertir PDF en HTML en C#.

Convertir une plage de pages de PDF en HTML

Nous pouvons convertir une plage de pages d’un document PDF en HTML par programmation en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF en utilisant la classe Converter avec le chemin du fichier d’entrée comme argument.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions.
  3. Ensuite, définissez le numéro de page pour commencer la conversion à partir de
  4. Après cela, définissez le nombre de pages pour convertir le nombre total de pages
  5. Enfin, appelez la Converter.Convert() method avec le chemin du fichier de sortie et les options de conversion pour enregistrer le fichier HTML converti.

L’exemple de code suivant montre comment convertir une plage de pages d’un document PDF en un fichier HTML en C#.

// Charger le fichier PDF source
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Définir les options de conversion pour le format HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Convertir au format HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Convertir des pages spécifiques de PDF en HTML

Nous pouvons convertir des pages spécifiques d’un document PDF en HTML en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF en utilisant la classe Converter avec le chemin du fichier d’entrée comme argument.
  2. Ensuite, créez une instance de la classe MarkupConvertOptions.
  3. Ensuite, fournissez des numéros de page spécifiques dans une liste séparée par des virgules à convertir.
  4. Enfin, appelez la Converter.Convert() method avec le chemin du fichier de sortie et les options de conversion pour enregistrer le fichier HTML converti.

L’exemple de code suivant montre comment convertir des pages spécifiques d’un document PDF en un fichier HTML en C#.

// Charger le fichier PDF source
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Définir les options de conversion pour le format HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Convertir au format HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Conversion PDF en HTML avec filigrane en C#

Nous pouvons convertir des documents PDF en pages Web HTML et ajouter des filigranes aux fichiers HTML convertis par programmation en suivant les étapes ci-dessous:

  1. Tout d’abord, chargez un document PDF en utilisant la classe Converter avec le chemin du fichier d’entrée comme argument.
  2. Ensuite, créez une instance de la classe WatermarkOptions.
  3. Ensuite, définissez diverses options telles que Text, Color, Width, Height, Font, etc.
  4. Ensuite, créez une instance de la classe MarkupConvertOptions.
  5. Après cela, attribuez WatermarkOptions à MarkupConvertOptions.
  6. Enfin, appelez la Converter.Convert() method avec le chemin du fichier de sortie et les options de conversion pour enregistrer le fichier HTML converti.

L’exemple de code suivant montre comment convertir un document PDF en un document HTML avec un filigrane.

// Charger le fichier PDF source
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Définir le filigrane de texte
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Définir les options de conversion pour le format HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Convertir au format HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Conversion PDF en HTML avec filigrane en C#.

Conversion PDF en HTML avec filigrane en C#.

Obtenez une licence gratuite

Veuillez essayer l’API sans limitation d’évaluation en demandant une licence temporaire gratuite.

Conclusion

Dans cet article, nous avons appris comment convertir des documents PDF en pages Web HTML en C#. Nous avons également vu comment convertir des pages spécifiques d’un PDF en HTML et ajouter un filigrane au fichier converti par programmation. En outre, vous pouvez en savoir plus sur l’API GroupDocs.Conversion pour .NET à l’aide de la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également