Konvertieren Sie HTML mit Java in Word

Konvertieren Sie HTML mit Java in Word

In diesem Blogbeitrag erfahren Sie, wie Sie HTML mithilfe von Java programmgesteuert in Word konvertieren. Glücklicherweise bietet diese Java-Bibliothek sofortige Dateiverarbeitung, -manipulation und -konvertierung. Sie können diese Bibliothek einfach ohne externe Abhängigkeiten installieren. Darüber hinaus ist eine umfassende Dokumentation zur Installation und Verwendung verfügbar. Microsoft Word-Dokumente sind die derzeit am weitesten verbreiteten Dateiformate. Daher werden wir Schritt für Schritt den Konvertierungsprozess von HTML nach Word demonstrieren.

Folgende Punkte werden wir behandeln:

Konvertieren Sie HTML in Word mit Java - API-Installation

Diese Java DOCX-Bibliothek bietet einen riesigen Stapel von Funktionen, die die Dateikonvertierungsprozesse beschleunigen. Es gibt Ihnen die Kontrolle über Daten- und Dateimanipulationsaufgaben. Um diese Bibliothek in Ihrer Java-Anwendung zu aktivieren, laden Sie die JAR-Dateien herunter oder folgen Sie den folgenden Maven-Konfigurationen.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Abhängigkeit

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

So konvertieren Sie eine Webseite programmgesteuert in Word

Das programmgesteuerte Konvertieren einer HTML-Seite in ein Word-Dokument ist supereinfach. Sie können diese Funktionalität erreichen, indem Sie einige der unten aufgeführten Schritte ausführen.

  1. Erstellen Sie eine Instanz der Klasse Document und laden Sie eine Quell-HTML-Datei.
  2. Rufen Sie die Methode save(java.lang.String fileName, int saveFormat) auf, um die Datei im DOCX-Format zu speichern.

Kopieren Sie den folgenden Code und fügen Sie ihn in Ihre Java-Datei ein, um die HTML-Datei in eine Word-Datei zu konvertieren.

// Erstellen Sie eine Instanz der Document-Klasse und laden Sie eine HTML-Quelldatei
Document document = new Document("index.html");
// Rufen Sie die Methode save(java.lang.String fileName, int saveFormat) auf, um die Datei im DOCX-Format zu speichern
document.save("output.docx", SaveFormat.DOCX);

HTML-zu-Word-Konvertierungsbibliothek - Erweiterte Funktionen

In diesem Abschnitt werden wir die erweiterten Funktionen wie das Festlegen der Dokumentqualität, das Einrichten eines Passworts und mehr untersuchen.

Sie können die folgenden Schritte und die Codeschnipsel durchgehen, um mehr über weitere Methoden zu erfahren:

  1. Erstellen Sie eine Instanz der Klasse Document und laden Sie eine Quell-HTML-Datei.
  2. Mit der Methode protect(int type, java.lang.String password) können Sie ein Kennwort festlegen, um das Dokument vor Änderungen zu schützen.
  3. unprotect() entfernt das Passwort.
  4. Setzen Sie diese setTrackRevisions-Methode auf True, wenn Änderungen nachverfolgt werden, wenn dieses Dokument in Microsoft Word bearbeitet wird.
  5. Rechtschreibfehler werden hervorgehoben, wenn die Methode setShowSpellingErrors True ist.
  6. Die Methode setShowGrammaticalErrors hebt die Grammatikfehler hervor, wenn sie wahr ist.
  7. removeAllChildren entfernt alle untergeordneten Knoten des aktuellen Knotens.
  8. Instanziieren Sie eine Instanz der Klasse DocSaveOptions.
  9. Rufen Sie die Methode setUseHighQualityRendering auf, um einen Wert festzulegen, der bestimmt, ob qualitativ hochwertige (dh langsame) Rendering-Algorithmen verwendet werden sollen oder nicht.
  10. Rufen Sie die Methode save(java.lang.String fileName, int saveFormat) auf, um die Datei im DOCX-Format zu speichern.
        // Erstellen Sie eine Instanz der Document-Klasse und laden Sie eine HTML-Quelldatei
        Document document = new Document("index.html");
        // Die Methode protect(int type, java.lang.String password) ermöglicht es Ihnen, ein Passwort festzulegen, um das Dokument vor Änderungen zu schützen
        document.protect(1,"password");
        // unprotect() entfernt das Passwort
        document.unprotect();
        // Setzen Sie diese setTrackRevisions-Methode auf True, wenn Änderungen nachverfolgt werden, wenn dieses Dokument in Microsoft Word bearbeitet wird.
        document.setTrackRevisions(true);
        // Rechtschreibfehler werden hervorgehoben, wenn die Methode setShowSpellingErrors True ist
        document.setShowSpellingErrors(true);
        // Die setShowGrammaticalErrors-Methode hebt die Grammatikfehler hervor, wenn sie wahr ist
        document.setShowGrammaticalErrors(true);
        // removeAllChildren entfernt alle untergeordneten Knoten des aktuellen Knotens.
        document.removeAllChildren();
        // Instanziieren Sie eine Instanz der DocSaveOptions-Klasse
        DocSaveOptions opt = new DocSaveOptions();
        // Rufen Sie die setUseHighQualityRendering-Methode auf, um einen Wert festzulegen, der bestimmt, ob qualitativ hochwertige (dh langsame) Rendering-Algorithmen verwendet werden sollen oder nicht.
        opt.setUseHighQualityRendering(true);
        // Rufen Sie die Methode save(java.lang.String fileName, int saveFormat) auf, um die Datei im DOCX-Format zu speichern
        document.save("output.docx", SaveFormat.DOCX);

Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz erhalten, um die API ohne Evaluierungseinschränkungen zu testen.

Zusammenfassen

Damit sind wir am Ende dieses Blogbeitrags angelangt. Wir haben behandelt, wie man HTML mit Java programmgesteuert in Word konvertiert. Darüber hinaus finden Sie die Code-Snippets der in den obigen Abschnitten erwähnten Funktionalität. Darüber hinaus können Sie die Dokumentation für andere Funktionen besuchen, die für Ihren HTML-zu-Word-Konverter von Vorteil sein können. Schließlich schreibt conholdate.com neue Blogbeiträge zu anderen Themen. Bitte bleiben Sie daher für regelmäßige Updates in Kontakt.

Stelle eine Frage

Sie können Ihre Fragen oder Fragen in unserem Forum teilen.

Siehe auch