在 Java 中将 Word 转换为 HTML

在 Java 中将 Word 转换为 HTML

如果您想为您的业务应用程序开发一个 Word 到 HTML 的转换器,那么这篇博文适合您。您可以安装此 Java Word 以将 Docx 文件转换为其他流行格式,例如 HTMLPNGPDF 等。但是,到本教程结束时,您应该对这个文件转换 Java 库有很好的了解。因此,让我们开始这篇文章,学习如何以编程方式在 Java 中将 Word 转换为 HTML。

将涵盖以下几点:

Java Word 库安装

该库的安装过程对开发人员非常友好,因为您可以找到有关开发和安装的综合文档。因此,您可以下载 JAR 文件或使用以下 Maven 配置安装此库。

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

在 Java 中将 Word 转换为 HTML

您已准备好在 Java 应用程序中编写源代码,以编程方式构建 Word 到 HTML 转换器。

以下是将 Word 转换为 HTML 的步骤:

  1. 创建 Document 类的实例并加载源 Word 文件。
  2. 初始化 HtmlSaveOptions 类的对象以在将文档保存为 HTML 格式时指定其他选项。
  3. 调用setExportRoundtripInformation指定保存为HTML时是否写入往返信息。
  4. 如果setExportFontResources方法的值为true,字体资源将导出为HTML。
  5. 调用setExportFontsAsBase64方法指定字体资源是否以Base64编码嵌入到HTML中。
  6. 现在,save 方法将以 HTML 格式保存 Word 文档。

将以下代码复制并粘贴到您的主文件中:

// 创建 Document 类的实例并加载源 Word 文件。 
Document doc = new Document(  "sample.doc");
// 初始化 HtmlSaveOptions 类的对象以在将文档保存为 HTML 格式时指定其他选项。  
HtmlSaveOptions options = new HtmlSaveOptions();
// 调用setExportRoundtripInformation 指定保存为HTML 时是否写入往返信息。
options.setExportRoundtripInformation(true);
// 如果 setExportFontResources 方法的值为 true,字体资源将导出为 HTML。
options.setExportFontResources(true);
// 调用 setExportFontsAsBase64 方法来指定字体资源是否应该以 Base64 编码嵌入到 HTML 中。
options.setExportFontsAsBase64(true);
// 现在,save 方法将以 HTML 格式保存 Word 文档。  
doc.save("Document_out.html", SaveFormat.HTML);

输出如下图所示:

word转html

获得免费许可证

您可以利用 免费临时许可证 试用 API,而不受评估限制。

加起来

我们可以在这里结束这篇博文。希望您喜欢这篇文章并学习了如何以编程方式将 Word 转换为 Java 中的 HTML。此 Java Word 库还公开了许多其他功能,因此请不要忘记访问 文档

此外,我们建议您遵循我们的入门指南

最后,conholdate.com 正在撰写新的博文。因此,请保持联系以获取定期更新。

问一个问题

您可以在我们的论坛 上让我们知道您的问题或疑问。

常见问题

如何将 DOCX 转换为 HTML?

创建Document类实例并加载源Word文件,调用save方法将Word文件保存为HTML格式。

也可以看看