这篇博文将教您如何以编程方式使用 Java 将 HTML 转换为 Word。幸运的是,这个 Java 库 提供了即时文件处理、操作和转换。您可以轻松安装此库,无需任何外部依赖项。此外,还有关于其安装和使用的全面文档。 Microsoft Word 文档是当前使用最广泛的文件格式。因此,我们将逐步演示HTML到Word的转换过程。
我们将涵盖以下几点:
使用 Java 将 HTML 转换为 Word - API 安装
这个 Java DOCX 库 提供了大量的特性来加速文件转换过程。它使您可以控制数据和文件操作任务。要在您的 Java 应用程序中启用此库,请下载 jar 文件,或者您可以遵循以下 Maven 配置。
存储库
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依赖
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
如何以编程方式将网页转换为 Word
以编程方式将 HTML 页面转换为 Word 文档非常简单。您可以通过执行下面提到的几个步骤来实现此功能。
- 创建 Document 类的实例并加载源 HTML 文件。
- 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式。
将以下代码复制并粘贴到您的 Java 文件中,以将 HTML 文件转换为 Word 文件。
// 创建 Document 类的实例并加载源 HTML 文件
Document document = new Document("index.html");
// 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式
document.save("output.docx", SaveFormat.DOCX);
HTML 到 Word 转换器库 - 高级功能
在本节中,我们将探讨设置文档质量、设置密码等高级功能。
您可以通过以下步骤和代码片段了解更多方法:
- 创建 Document 类的实例并加载源 HTML 文件。
- protect(int type, java.lang.String password) 方法将使您能够设置密码以保护文档免受任何更改。
- unprotect() 将删除密码。
- 如果在 Microsoft Word 中编辑此文档时跟踪更改,则将此 setTrackRevisions 方法设置为 True。
- 如果 setShowSpellingErrors 方法为 True,则会突出显示拼写错误。
- setShowGrammaticalErrors 方法将在 True 时突出显示语法错误。
- removeAllChildren 删除当前节点的所有子节点。
- 实例化 DocSaveOptions 类的实例。
- 调用 setUseHighQualityRendering 方法来设置一个值来确定是否使用高质量(即慢速)渲染算法。 10.调用save(java.lang.String fileName, int saveFormat)方法将文件保存为DOCX格式。
// 创建 Document 类的实例并加载源 HTML 文件
Document document = new Document("index.html");
// Protect(int type, java.lang.String password) 方法将使您能够设置密码以保护文档免受任何更改
document.protect(1,"password");
// unprotect() 将删除密码
document.unprotect();
// 如果在 Microsoft Word 中编辑此文档时跟踪更改,则将此 setTrackRevisions 方法设置为 True。
document.setTrackRevisions(true);
// 如果 setShowSpellingErrors 方法为 True,则会突出显示拼写错误
document.setShowSpellingErrors(true);
// 如果为 True,setShowGrammaticalErrors 方法将突出显示语法错误
document.setShowGrammaticalErrors(true);
// removeAllChildren 删除当前节点的所有子节点。
document.removeAllChildren();
// 实例化 DocSaveOptions 类的实例
DocSaveOptions opt = new DocSaveOptions();
// 调用 setUseHighQualityRendering 方法来设置一个值来确定是否使用高质量(即慢速)渲染算法。
opt.setUseHighQualityRendering(true);
// 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式
document.save("output.docx", SaveFormat.DOCX);
获得免费许可证
您可以获得 免费临时许可证 来试用 API,而不受评估限制。
加起来
这将我们带到这篇博文的结尾。我们已经介绍了如何以编程方式使用 Java 将 HTML 转换为 Word。此外,您可以找到上述部分中提到的功能的代码片段。此外,您可以访问 文档 以了解对您的 HTML 到 Word 转换器有益的其他功能。最后,conholdate.com 正在撰写有关其他主题的新博客文章。因此,请保持联系以获取定期更新。
问一个问题
您可以在我们的 论坛 上分享您的问题或疑问。