
在 Java 中将 Word 转换为 HTML
如果您想为您的业务应用程序开发一个 Word 到 HTML 的转换器,那么这篇博文适合您。您可以安装此 Java Word 库 以将 Docx 文件转换为其他流行格式,例如 HTML、PNG、PDF 等。但是,到本教程结束时,您应该对这个文件转换 Java 库有很好的了解。因此,让我们开始这篇文章,学习如何以编程方式在 Java 中将 Word 转换为 HTML。
将涵盖以下几点:
Java Word 库安装
该库的安装过程对开发人员非常友好,因为您可以找到有关开发和安装的综合文档。因此,您可以下载 JAR 文件或使用以下 Maven 配置安装此库。
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.10</version>
<classifier>jdk17</classifier>
</dependency>
在 Java 中将 Word 转换为 HTML
您已准备好在 Java 应用程序中编写源代码,以编程方式构建 Word 到 HTML 转换器。
以下是将 Word 转换为 HTML 的步骤:
- 创建 Document 类的实例并加载源 Word 文件。
- 初始化 HtmlSaveOptions 类的对象以在将文档保存为 HTML 格式时指定其他选项。
- 调用setExportRoundtripInformation指定保存为HTML时是否写入往返信息。
- 如果setExportFontResources方法的值为true,字体资源将导出为HTML。
- 调用setExportFontsAsBase64方法指定字体资源是否以Base64编码嵌入到HTML中。
- 现在,save 方法将以 HTML 格式保存 Word 文档。
将以下代码复制并粘贴到您的主文件中:
// 创建 Document 类的实例并加载源 Word 文件。
Document doc = new Document( "sample.doc");
// 初始化 HtmlSaveOptions 类的对象以在将文档保存为 HTML 格式时指定其他选项。
HtmlSaveOptions options = new HtmlSaveOptions();
// 调用setExportRoundtripInformation 指定保存为HTML 时是否写入往返信息。
options.setExportRoundtripInformation(true);
// 如果 setExportFontResources 方法的值为 true,字体资源将导出为 HTML。
options.setExportFontResources(true);
// 调用 setExportFontsAsBase64 方法来指定字体资源是否应该以 Base64 编码嵌入到 HTML 中。
options.setExportFontsAsBase64(true);
// 现在,save 方法将以 HTML 格式保存 Word 文档。
doc.save("Document_out.html", SaveFormat.HTML);
输出如下图所示:

获得免费许可证
您可以利用 免费临时许可证 试用 API,而不受评估限制。
加起来
我们可以在这里结束这篇博文。希望您喜欢这篇文章并学习了如何以编程方式将 Word 转换为 Java 中的 HTML。此 Java Word 库还公开了许多其他功能,因此请不要忘记访问 文档。
此外,我们建议您遵循我们的入门指南。
最后,conholdate.com 正在撰写新的博文。因此,请保持联系以获取定期更新。
问一个问题
您可以在我们的论坛 上让我们知道您的问题或疑问。
常见问题
如何将 DOCX 转换为 HTML?
创建Document类实例并加载源Word文件,调用save方法将Word文件保存为HTML格式。