Konvertieren Sie Word in Java in HTML

Konvertieren Sie Word in Java in HTML

Dieser Blogbeitrag ist für Sie, wenn Sie einen Word-zu-HTML-Konverter für Ihre Geschäftsanwendung entwickeln möchten. Sie können diese Java Word Bibliothek installieren, um Docx-Dateien in andere gängige Formate wie HTML, PNG, PDF und mehr zu konvertieren. Am Ende dieses Tutorials sollten Sie jedoch über gute Kenntnisse dieser Java-Bibliothek zur Dateikonvertierung verfügen. Lassen Sie uns daher mit dem Artikel beginnen und lernen, wie Sie Word in Java programmgesteuert in HTML konvertieren.

Folgende Punkte werden behandelt:

Installation der Java-Word-Bibliothek

Der Installationsprozess dieser Bibliothek ist sehr entwicklerfreundlich, da Sie eine umfassende Dokumentation zur Entwicklung und Installation finden. Sie können also die JAR-Datei herunterladen oder diese Bibliothek mit den folgenden Maven-Konfigurationen installieren.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Konvertieren Sie Word in Java in HTML

Sie sind bereit, Quellcode in Ihrer Java-Anwendung zu schreiben, um Word-zu-HTML-Konverter programmgesteuert zu erstellen.

Im Folgenden sind die Schritte zum Konvertieren von Word in HTML aufgeführt:

  1. Erstellen Sie eine Instanz der Klasse Document und laden Sie die Word-Quelldatei.
  2. Initialisieren Sie ein Objekt der Klasse HtmlSaveOptions, um zusätzliche Optionen beim Speichern eines Dokuments in den HTML-Formaten anzugeben.
  3. Rufen Sie setExportRoundtripInformation auf, um anzugeben, ob die Roundtrip-Informationen beim Speichern in HTML geschrieben werden sollen.
  4. Wenn der Wert der Methode setExportFontResources wahr ist, werden Schriftressourcen in HTML exportiert.
  5. Rufen Sie die Methode setExportFontsAsBase64 auf, um anzugeben, ob Schriftartressourcen in HTML in Base64-Codierung eingebettet werden sollen.
  6. Jetzt speichert die Methode save das Word-Dokument im HTML-Format.

Kopieren Sie den folgenden Code und fügen Sie ihn in Ihre Hauptdatei ein:

// Erstellen Sie eine Instanz der Document-Klasse und laden Sie die Word-Quelldatei. 
Document doc = new Document(  "sample.doc");
// Initialisieren Sie ein Objekt der HtmlSaveOptions-Klasse, um zusätzliche Optionen beim Speichern eines Dokuments in den HTML-Formaten anzugeben.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Rufen Sie setExportRoundtripInformation auf, um anzugeben, ob die Roundtrip-Informationen beim Speichern in HTML geschrieben werden sollen.
options.setExportRoundtripInformation(true);
// Wenn der Wert der Methode setExportFontResources wahr ist, werden Schriftartressourcen in HTML exportiert.
options.setExportFontResources(true);
// Rufen Sie die setExportFontsAsBase64-Methode auf, um anzugeben, ob Schriftartressourcen in HTML in Base64-Codierung eingebettet werden sollen.
options.setExportFontsAsBase64(true);
// Jetzt speichert die Save-Methode das Word-Dokument im HTML-Format.  
doc.save("Document_out.html", SaveFormat.HTML);

Die Ausgabe ist im Bild unten zu sehen:

Wort zu html

Holen Sie sich eine kostenlose Lizenz

Sie können eine kostenlose temporäre Lizenz in Anspruch nehmen, um die API ohne Evaluierungseinschränkungen zu testen.

Zusammenfassen

Wir können diesen Blogbeitrag hier beenden. Hoffentlich hat Ihnen der Artikel gefallen und Sie haben gelernt, wie Sie Word in Java programmgesteuert in HTML konvertieren. Diese Java-Word-Bibliothek bietet viele weitere Funktionen, also vergessen Sie nicht, die Dokumentation zu besuchen.

Außerdem empfehlen wir Ihnen, unserem Leitfaden „Erste Schritte“ zu folgen.

Schließlich schreibt conholdate.com neue Blogbeiträge. Bitte bleiben Sie also in Kontakt, um regelmäßige Updates zu erhalten.

Stelle eine Frage

Sie können uns Ihre Fragen oder Anliegen in unserem Forum mitteilen.

Häufig gestellte Fragen

Wie konvertiere ich ein DOCX in HTML?

Erstellen Sie eine Instanz der Klasse Document, laden Sie die Word-Quelldatei und rufen Sie die Methode save auf, um die Word-Datei im HTML-Format zu speichern.

Siehe auch