Convert PDF to Word using Java

Sie können Ihre PDF-Dokumente ganz einfach programmgesteuert in Ihren Java-Anwendungen in Word-Dokumente (.docx oder .doc) konvertieren. Eine solche Konvertierung ist nützlich, wenn Sie den Text Ihrer PDF-Dokumente bearbeiten oder die Textformatierung anwenden müssen. In diesem Artikel erfahren Sie, wie Sie mit Java PDF in Word konvertieren.

Die folgenden Themen werden in diesem Artikel behandelt/behandelt:

Java-API zum Konvertieren von PDF in Word

Ich werde GroupDocs.Conversion for Java API für die Konvertierung von PDF in DOCX verwenden. Diese API bietet eine schnelle, effiziente und zuverlässige Dateikonvertierungslösung in Java-Anwendungen, ohne dass externe Software installiert werden muss. Es unterstützt Konvertierungen zwischen allen gängigen Geschäftsdokumentformaten wie PDF, HTML, E-Mail, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, Rasterbilddateiformaten und vielen mehr. Es ermöglicht Ihnen auch, das gesamte Dokument anzuzeigen oder es teilweise zu rendern, um den Prozess zu beschleunigen. Die API ist mit allen Java-Versionen kompatibel und unterstützt gängige Betriebssysteme (Windows, Linux, macOS), die die Java-Laufzeit ausführen können.

Herunterladen und konfigurieren

Sie können das JAR der API herunterladen oder einfach die folgende pom.xml-Konfiguration in Ihrer Maven-basierten Java-Anwendung hinzufügen, um die unten aufgeführten Codebeispiele auszuprobieren.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Konvertieren Sie PDF mit Java in Word

Sie können PDF-Dokumente in Word konvertieren, indem Sie die folgenden einfachen Schritte ausführen:

  1. Erstellen Sie eine Instanz der Klasse Converter.
  2. Geben Sie den Eingabedateipfad an
  3. Erstellen Sie eine Instanz von WordProcessingConvertOptions
  4. Legen Sie die Startseitennummer fest
  5. Geben Sie die Gesamtzahl der zu konvertierenden Seiten an
  6. Ausgabedateiformat festlegen
  7. Rufen Sie die Methode Convert() zusammen mit dem Ausgabedateipfad und den Konvertierungsoptionen auf

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei mit Java in ein Word-Dokument konvertieren.

// Konverter erstellen
Converter Konvertierener = new Converter("C:\\Files\\sample.pdf");

// Legen Sie Word-Konvertierungsoptionen fest
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// Konvertieren
Konvertierener.Konvertieren("C:\\Files\\output.docx", options);
Konvertieren Sie PDF mit Java in Word

Konvertieren Sie PDF mit Java in Word

Die Klasse Converter ist die Hauptklasse, die den Dokumentenkonvertierungsprozess steuert. Es bietet verschiedene Methoden zum Konvertieren von Dokumenten in unterstützte Dateiformate. Die Methode Convert() dieser Klasse konvertiert Quelldokumente und verwendet zwei Eingabeparameter, den Dateipfad zum Quelldokument und ConvertOptions, um ein bestimmtes Quelldokument in den gewünschten Zieldateityp zu konvertieren.

Die Klasse WordProcessingConvertOptions bietet Optionen für die Konvertierung in den Dateityp WordProcessing. Die Methode setPageNumber() ermöglicht das Festlegen der Startseitennummer zum Starten der Konvertierung. Die Methode setPagesCount() hingegen definiert die Gesamtzahl der zu konvertierenden Seiten ab der definierten Seitenzahl. Mit der Methode setFormat() dieser Klasse können Sie das Ausgabeformat des konvertierten Dokuments festlegen. Als Eingabe wird der Aufzählungstyp WordProcessingFileType verwendet.

Konvertieren Sie bestimmte Seiten von PDF in Word

Sie können bestimmte Seiten eines PDF-Dokuments in Word konvertieren, indem Sie die folgenden einfachen Schritte ausführen:

  1. Erstellen Sie eine Instanz der Klasse Converter.
  2. Geben Sie den Eingabedateipfad an
  3. Erstellen Sie eine Instanz von WordProcessingConvertOptions
  4. Legen Sie die Seitenzahlenliste zum Konvertieren fest
  5. Rufen Sie die Methode Convert() zusammen mit dem Ausgabedateipfad und den Konvertierungsoptionen auf

Das folgende Codebeispiel zeigt, wie bestimmte Seiten aus einer PDF-Datei mit Java in ein Word-Dokument konvertiert werden.

// Konverter erstellen
Converter Konvertierener = new Converter("C:\\Files\\sample.pdf");

// Word-Konvertierungsoptionen definieren
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// Konvertieren
Konvertierener.Konvertieren("C:\\Files\\output.docx", options);

Die Klasse WordProcessingConvertOptions stellt die Methode setPages() bereit, um bestimmte Seitenzahlen zu konvertieren, die in einer durch Kommas getrennten Liste aus einem Quelldokument definiert sind.

Laden Sie ein passwortgeschütztes PDF und konvertieren Sie es in Word

Sie können passwortgeschützte PDF-Dokumente in Word konvertieren, indem Sie die folgenden einfachen Schritte ausführen:

  1. PdfLoadOptions erstellen
  2. Passwort festlegen
  3. Erstellen Sie eine Instanz der Klasse Converter.
  4. Geben Sie den Eingabedateipfad an
  5. Erstellen Sie eine Instanz von WordProcessingConvertOptions
  6. Rufen Sie die Methode Convert() zusammen mit dem Ausgabedateipfad und den Konvertierungsoptionen auf

Das folgende Codebeispiel zeigt, wie Sie eine passwortgeschützte PDF-Datei mit Java in ein Word-Dokument konvertieren.

// PDF-Ladeoptionen
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// Konverter erstellen
Converter Konvertierener = new Converter("C:\\Files\\sample.pdf", loadOptions);

// Word-Konvertierungsoptionen definieren
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// Konvertieren
Konvertierener.Konvertieren("C:\\Files\\output.docx", options);

Die Klasse PdfLoadOptions bietet verschiedene Optionen zum Laden von PDF-Dokumenten. Die Methode setPassword() dieser Klasse ermöglicht es Ihnen, den Schutz des geschützten Dokuments aufzuheben, indem Sie sein Passwort angeben.

Weitere Details zu „PDF-Dokument mit Optionen laden“ finden Sie in der Dokumentation.

Holen Sie sich eine kostenlose Lizenz

Sie können die API ohne Evaluierungseinschränkungen testen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie PDF-Dokumente mit Java in Word konvertieren. Außerdem haben Sie gelernt, wie Sie eine passwortgeschützte PDF-Datei in ein Word-Dokument konvertieren. Außerdem haben Sie gelernt, wie Sie bestimmte Seiten aus einem PDF-Dokument programmgesteuert in ein Word-Dokument konvertieren. Sie können noch mehr über GroupDocs.Conversion Java API erfahren, indem Sie die Dokumentation verwenden. Bei Unklarheiten können Sie sich gerne im Forum an uns wenden.

Siehe auch