Bearbeiten Sie Word DOCX mit Java

Sie können alle Textverarbeitungsdokumentformate wie DOC, DOCX oder DOTM einfach programmgesteuert bearbeiten. Als Java-Entwickler können Sie Word-Dokumente in Ihren Java-Anwendungen bearbeiten. In diesem Artikel erfahren Sie, wie Sie Word-Dokumente mit Java bearbeiten.

Die folgenden Themen werden in diesem Artikel behandelt/behandelt:

Java-API zum Bearbeiten von Word-Dokumenten

Zum Bearbeiten von DOCX-Dateien verwende ich die GroupDocs.Editor for Java-API. Es ermöglicht Ihnen, Textverarbeitungsdokumente, Excel-Tabellen oder Dokumente anderer unterstützter Formate programmgesteuert zu bearbeiten. Die API ermöglicht es Ihnen, Dokumente zu laden und sie in HTML umzuwandeln. Es stellt HTML für die externe Benutzeroberfläche zur Bearbeitung bereit und speichert HTML nach der Bearbeitung im Originaldokument.

Sie können das JAR der API herunterladen oder einfach die folgende pom.xml-Konfiguration zu Ihren Maven-basierten Java-Anwendungen hinzufügen, um die unten aufgeführten Codebeispiele auszuprobieren.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11.0</version> 
</dependency>

Bearbeiten Sie Word-Dokumente mit Java

Sie können Word-Dokumente ganz einfach programmgesteuert bearbeiten, indem Sie die folgenden einfachen Schritte ausführen:

  • WordProcessingLoadOptions definieren
  • Erstellen Sie eine Instanz der Klasse Editor.
  • Geben Sie den Pfad zur DOCX-Eingabedatei an
  • WordProcessingEditOptions definieren
  • Rufen Sie die Methode edit() auf und rufen Sie das Objekt EditableDocument ab
  • Holen Sie sich Dokumentinhalte und zugehörige Ressourcen von EditableDocument
  • Rufen Sie die Methode getEmbeddedHtml() auf, um das Dokument als einzelne base64-codierte Zeichenfolge abzurufen
  • Aktualisieren Sie den Inhalt, indem Sie die Methode replace() aufrufen
  • Rufen Sie die Methode fromMarkup() auf und erstellen Sie eine neue EditableDocument-Instanz
  • WordProcessingSaveOptions definieren
  • Rufen Sie die Methode save() auf und speichern Sie die aktualisierte Datei
  • Entsorgen Sie die Gegenstände

Das folgende Codebeispiel zeigt, wie DOCX-Dateien mit Java bearbeitet werden.

//Eingabedatei
String inputFilePath = "C:\\Files\\Sample.docx";

//Laden Sie das Dokument mit Ladeoptionen
WordProcessingLoadOptions wordLoadOptions = new WordProcessingLoadOptions();
wordLoadOptions.setPassword("some password"); // Password if required
Editor editor = new Editor(inputFilePath, wordLoadOptions);

// Geben Sie Bearbeitungsoptionen an
WordProcessingEditOptions editOptions = new WordProcessingEditOptions();
editOptions.setEnableLanguageInformation(true);
editOptions.setEnablePagination(true);

//Eingabedokument zum Bearbeiten öffnen
EditableDocument beforeEdit = editor.edit(editOptions);

//Holen Sie sich den Dokumentinhalt und die zugehörigen Ressourcen aus einem bearbeitbaren Dokument
String content = beforeEdit.getContent();
List<IImageResource> images = beforeEdit.getImages();
List<FontResourceBase> fonts = beforeEdit.getFonts();
List<CssText> stylesheets = beforeEdit.getCss();

//Holen Sie sich das Dokument als einen einzelnen base64-codierten String, in dem alle Ressourcen (Bilder, Schriftarten usw.) zusammen mit dem Haupttextinhalt in diesen String eingebettet sind
String allEmbeddedInsideString = beforeEdit.getEmbeddedHtml();
//Bearbeiten Sie den Inhalt
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("Subtitle", "Edited subtitle");

//Erstellen Sie eine neue EditableDocument-Instanz aus bearbeiteten Inhalten und Ressourcen
EditableDocument afterEdit = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);

//Pfad des Ausgabedokuments
String outputPath = "C:\\Files\\Sample_output.docx";
//Optionen speichern
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
//Speichern Sie abschließend im Pfad
editor.save(afterEdit, outputPath, saveOptions);

//Entsorgen Sie die Gegenstände
beforeEdit.dispose();
afterEdit.dispose();
editor.dispose();
Bearbeiten Sie Word-Dokumente mit Java

Bearbeiten Sie Word-Dokumente mit Java

Die Klasse WordprocessingLoadOptions bietet verschiedene Optionen zum Laden von Word-Dokumenten wie DOC, DOCX, RTF, ODT usw. in die Editor-Klasse.

  • Die Methode setPassword ermöglicht die Angabe des Passworts zum Öffnen der passwortgeschützten Dokumente.

Die Klasse Editor ist die Hauptklasse, die Methoden zum Laden, Bearbeiten und Speichern von Dokumenten aller unterstützten Formate bereitstellt.

Mit der Klasse WordProcesingEditOptions können Sie benutzerdefinierte Optionen zum Öffnen der zu bearbeitenden Textverarbeitungsdokumente angeben.

  • Die Methode setEnabledLanguageInformation gibt an, ob Sprachinformationen in Form von „lang“-HTML-Attributen in das HTML-Markup exportiert werden.
  • Die Methode setEnablePagination ermöglicht das Aktivieren oder Deaktivieren der Paginierung im resultierenden HTML-Dokument.

Die Klasse EditableDocument speichert das Dokument intern und stellt Methoden zum Generieren von HTML-Markup und zum Produzieren von Ressourcen bereit.

Die Klasse WordProcessingSaveOptions bietet benutzerdefinierte Optionen zum Generieren und Speichern von Word-Dokumenten nach der Bearbeitung.

Holen Sie sich eine kostenlose Lizenz

Sie können die API ohne Evaluierungseinschränkungen testen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Word-Dokumente mit Java bearbeiten. Weitere Informationen zu GroupDocs.Editor für die Java-API finden Sie in der Dokumentation. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch