Konvertieren Sie PDF in HTML mit C#

PDF ist das beliebteste Format zum Teilen und Drucken von Dokumenten. In bestimmten Fällen müssen wir möglicherweise PDF-Dokumente in HTML-Webseiten konvertieren. Eine solche Konvertierung hilft dabei, den Inhalt von PDF-Dokumenten zu teilen, sodass relevante Interessengruppen sie problemlos in jedem Browser anzeigen können. In diesem Artikel erfahren Sie, wie Sie PDF-Dokumente mit C# in HTML-Webseiten konvertieren.

Folgende Themen sollen in diesem Artikel behandelt werden:

C#-API zum Konvertieren von PDF in HTML – kostenloser Download

Wir werden die API GroupDocs.Conversion for .NET verwenden, um PDF in HTML zu konvertieren. Es bietet schnelle, effiziente und zuverlässige Dateikonvertierungslösungen für Endbenutzer. Bitte entweder die DLL der API herunterladen oder mit NuGet installieren.

Install-Package GroupDocs.Conversion

PDF-zu-HTML-Konvertierung mit C#

Wir können PDF-Dokumente ganz einfach programmgesteuert in HTML-Webseiten konvertieren, indem wir die folgenden einfachen Schritte befolgen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter mit dem Pfad der Eingabedatei als Argument. Es ist die Hauptklasse, die den Dokumentenkonvertierungsprozess steuert.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions. Es bietet verschiedene Optionen für die Konvertierung in Markup-Dateitypen.
  3. Stellen Sie dann optional verschiedene Konvertierungsoptionen wie FixedLayout, FixedLayoutShowBorders usw. ein.
  4. Rufen Sie schließlich die Methode Converter.Convert() auf, um die konvertierte HTML-Datei zu speichern. Diese Methode nimmt den Pfad der Ausgabedatei und Konvertierungsoptionen als Argument.

Das folgende Codebeispiel zeigt, wie Sie ein PDF-Dokument mit C# in eine HTML-Webseite konvertieren.

// Laden Sie die PDF-Quelldatei
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Legen Sie die Konvertierungsoptionen für das HTML-Format fest
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Konvertieren in das HTML-Format
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Konvertieren Sie PDF in HTML in C#.

Konvertieren Sie PDF in HTML in C#.

Konvertieren Sie den Seitenbereich von PDF in HTML

Wir können eine Reihe von Seiten eines PDF-Dokuments programmgesteuert in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter mit dem Pfad der Eingabedatei als Argument.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  3. Legen Sie dann die Seitenzahl fest, ab der die Konvertierung beginnen soll
  4. Stellen Sie danach die Seitenzahl ein, um die Gesamtzahl der Seiten umzuwandeln
  5. Rufen Sie schließlich die Methode Converter.Convert() mit dem Ausgabedateipfad und den Konvertierungsoptionen auf, um die konvertierte HTML-Datei zu speichern.

Das folgende Codebeispiel zeigt, wie Sie einen Seitenbereich aus einem PDF-Dokument in eine HTML-Datei in C# konvertieren.

// Laden Sie die PDF-Quelldatei
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Legen Sie die Konvertierungsoptionen für das HTML-Format fest
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Konvertieren in das HTML-Format
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Konvertieren Sie bestimmte Seiten von PDF in HTML

Wir können bestimmte Seiten eines PDF-Dokuments in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter mit dem Pfad der Eingabedatei als Argument.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  3. Geben Sie dann bestimmte Seitenzahlen in einer durch Kommas getrennten Liste zum Konvertieren an.
  4. Rufen Sie schließlich die Methode Converter.Convert() mit dem Ausgabedateipfad und den Konvertierungsoptionen auf, um die konvertierte HTML-Datei zu speichern.

Das folgende Codebeispiel zeigt, wie bestimmte Seiten eines PDF-Dokuments in C# in eine HTML-Datei konvertiert werden.

// Laden Sie die PDF-Quelldatei
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Legen Sie die Konvertierungsoptionen für das HTML-Format fest
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Konvertieren in das HTML-Format
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

PDF-zu-HTML-Konvertierung mit Wasserzeichen in C#

Wir können PDF-Dokumente in HTML-Webseiten konvertieren und Wasserzeichen zu konvertierten HTML-Dateien programmgesteuert hinzufügen, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter mit dem Pfad der Eingabedatei als Argument.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse WatermarkOptions.
  3. Stellen Sie dann verschiedene Optionen wie Text, Farbe, Breite, Höhe, Schriftart usw. ein.
  4. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  5. Weisen Sie danach WatermarkOptions MarkupConvertOptions zu.
  6. Rufen Sie schließlich die Methode Converter.Convert() mit dem Ausgabedateipfad und den Konvertierungsoptionen auf, um die konvertierte HTML-Datei zu speichern.

Das folgende Codebeispiel zeigt, wie Sie ein PDF-Dokument in ein HTML-Dokument mit Wasserzeichen konvertieren.

// Laden Sie die PDF-Quelldatei
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Textwasserzeichen definieren
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Legen Sie die Konvertierungsoptionen für das HTML-Format fest
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Konvertieren in das HTML-Format
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
PDF-zu-HTML-Konvertierung mit Wasserzeichen in C#.

PDF-zu-HTML-Konvertierung mit Wasserzeichen in C#.

Holen Sie sich eine kostenlose Lizenz

Bitte testen Sie die API ohne Evaluierungseinschränkungen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben wir gelernt, wie man PDF-Dokumente in C# in HTML-Webseiten konvertiert. Wir haben auch gesehen, wie man bestimmte Seiten einer PDF-Datei in HTML konvertiert und der konvertierten Datei programmgesteuert ein Wasserzeichen hinzufügt. Außerdem können Sie mithilfe der Dokumentation mehr über GroupDocs.Conversion für die .NET-API erfahren. Bei Unklarheiten können Sie sich gerne im Forum an uns wenden.

Siehe auch