Konvertieren Sie PDF in HTML mit Java

PDF bietet die Möglichkeit, schreibgeschützte Dokumente zu teilen und zu drucken, ohne die Formatierung der Dokumente zu verlieren. Wir können PDF-Dokumente einfach in HTML-Webseiten konvertieren und sie in jedem Browser anzeigen. In diesem Artikel erfahren Sie, wie Sie PDF-Dokumente mit Java in HTML-Webseiten konvertieren.

Folgende Themen sollen in diesem Artikel behandelt werden:

Java-API zum Konvertieren von PDF in HTML – kostenloser Download

Zum Konvertieren von PDF in HTML verwenden wir die API GroupDocs.Conversion for Java. Es bietet schnelle, effiziente und zuverlässige Dateikonvertierungslösungen für Endbenutzer. Bitte entweder die JAR-Datei der API herunterladen oder einfach die folgende pom.xml-Konfiguration in einer Maven-basierten Java-Anwendung hinzufügen.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

PDF-zu-HTML-Konvertierung mit Java

Wir können PDF-Dokumente ganz einfach programmgesteuert in HTML-Webseiten konvertieren, indem wir die folgenden einfachen Schritte befolgen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  3. Stellen Sie dann optional verschiedene Konvertierungsoptionen wie FixedLayout, FixedLayoutShowBorders usw. ein.
  4. Konvertieren Sie abschließend PDF mit der Methode Converter.Convert() in HTML. Es nimmt den Pfad der Ausgabedatei und Konvertierungsoptionen als Argumente.

Das folgende Codebeispiel zeigt, wie Sie ein PDF-Dokument mit Java in eine HTML-Webseite konvertieren.

// Dieses Codebeispiel zeigt, wie Sie ein PDF-Dokument in eine HTML-Datei konvertieren.
// Initialisieren Sie das Konvertieren-Klassenobjekt
Konvertierener converter = new Konvertierener("C:\\Files\\Conversion\\sample.pdf");

// Konvertierungsoptionen definieren
MarkupKonvertierenOptions options = new MarkupKonvertierenOptions();
options.setFixedLayout(true);

// Konvertieren
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
PDF-zu-HTML-Konvertierung mit Java

PDF-zu-HTML-Konvertierung mit Java.

Konvertieren Sie den Seitenbereich von PDF in HTML

Wir können eine Reihe von Seiten eines PDF-Dokuments in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  3. Legen Sie dann die Seitenzahl fest, ab der die Konvertierung beginnen soll.
  4. Stellen Sie danach die Seitenzahl ein, um die Gesamtzahl der Seiten umzuwandeln.
  5. Konvertieren Sie abschließend PDF mit der Methode Converter.Convert() in HTML.

Das folgende Codebeispiel zeigt, wie Sie mit Java einen Seitenbereich aus einem PDF-Dokument in eine HTML-Datei konvertieren.

// Dieses Codebeispiel zeigt, wie Sie eine Reihe von PDF-Seiten in eine HTML-Datei konvertieren.
// Initialisieren Sie das Konvertieren-Klassenobjekt
Konvertierener converter = new Konvertierener("C:\\Files\\Conversion\\sample.pdf");

// Konvertierungsoptionen definieren
MarkupKonvertierenOptions options = new MarkupKonvertierenOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Konvertieren
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Konvertieren Sie bestimmte Seiten von PDF in HTML

Wir können bestimmte Seiten eines PDF-Dokuments in HTML konvertieren, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  3. Geben Sie dann bestimmte Seitenzahlen in einer durch Kommas getrennten Liste zum Konvertieren an.
  4. Konvertieren Sie abschließend PDF mit der Methode Converter.Convert() in HTML.

Das folgende Codebeispiel zeigt, wie bestimmte Seiten eines PDF-Dokuments mit Java in eine HTML-Datei konvertiert werden.

// Dieses Codebeispiel zeigt, wie bestimmte Seiten eines PDF-Dokuments in eine HTML-Datei konvertiert werden.
// Initialisieren Sie das Konvertieren-Klassenobjekt
Konvertierener converter = new Konvertierener("C:\\Files\\Conversion\\sample.pdf");

// Konvertierungsoptionen definieren
MarkupKonvertierenOptions options = new MarkupKonvertierenOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Konvertieren
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Konvertieren Sie passwortgeschützte PDFs in HTML in Java

Wir können auch passwortgeschützte PDF-Dokumente in HTML-Webseiten konvertieren, indem wir die folgenden Schritte ausführen:

  1. Geben Sie zunächst das Passwort mit dem Klassenobjekt PdfLoadOptions an.
  2. Laden Sie als Nächstes ein PDF-Dokument mithilfe der Klasse Converter mit PdfLoadOptions.
  3. Erstellen Sie dann eine Instanz der Klasse MarkupConvertOptions.
  4. Konvertieren Sie abschließend PDF mit der Methode Converter.Convert() in HTML.

Das folgende Codebeispiel zeigt, wie Sie ein passwortgeschütztes PDF-Dokument mit Java in ein HTML-Dokument konvertieren.

// Dieses Codebeispiel zeigt, wie passwortgeschütztes PDF in HTML konvertiert wird.
// Ladeoptionen definieren
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Initialisieren Sie das Konvertieren-Klassenobjekt
Konvertierener converter = new Konvertierener("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Konvertierungsoptionen definieren
MarkupKonvertierenOptions options = new MarkupKonvertierenOptions();

// Konvertieren
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

PDF-zu-HTML-Konvertierung mit Wasserzeichen in Java

Wir können PDF-Dokumente in HTML-Webseiten konvertieren und Wasserzeichen zu konvertierten HTML-Dateien hinzufügen, indem wir die folgenden Schritte ausführen:

  1. Laden Sie zunächst ein PDF-Dokument mit der Klasse Converter.
  2. Erstellen Sie als Nächstes eine Instanz der Klasse WatermarkOptions.
  3. Stellen Sie dann verschiedene Optionen wie Text, Farbe, Breite, Höhe, Schriftart usw. ein.
  4. Erstellen Sie als Nächstes eine Instanz der Klasse MarkupConvertOptions.
  5. Weisen Sie danach WatermarkOptions MarkupConvertOptions zu.
  6. Konvertieren Sie abschließend PDF mit der Methode Converter.Convert() in HTML.

Das folgende Codebeispiel zeigt, wie Sie ein PDF-Dokument in ein HTML-Dokument mit Wasserzeichen konvertieren.

// Dieses Codebeispiel zeigt, wie Sie ein PDF mit Wasserzeichen in HTML konvertieren.
// Initialisieren Sie das Konvertieren-Klassenobjekt
Konvertierener converter = new Konvertierener("C:\\Files\\Conversion\\sample.pdf");

// Wasserzeichen definieren 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Konvertierungsoptionen definieren
MarkupKonvertierenOptions options = new MarkupKonvertierenOptions();
options.setWatermark(watermark);

// Pfad der Ausgabedatei
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Konvertieren
converter.convert(outputFile, options);
PDF-zu-HTML-Konvertierung mit Wasserzeichen in Java

PDF-zu-HTML-Konvertierung mit Wasserzeichen in Java.

Holen Sie sich eine kostenlose Lizenz

Bitte testen Sie die API ohne Evaluierungseinschränkungen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben wir gelernt, wie man PDF-Dokumente in HTML-Webseiten in Java konvertiert. Wir haben auch gesehen, wie man eine passwortgeschützte PDF-Datei in HTML konvertiert und der konvertierten Datei programmgesteuert ein Wasserzeichen hinzufügt. Außerdem können Sie in der Dokumentation mehr über GroupDocs.Conversion for Java API erfahren. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch