使用 Java 将 HTML 转换为 Word

使用 Java 将 HTML 转换为 Word

这篇博文将教您如何以编程方式使用 Java 将 HTML 转换为 Word。幸运的是,这个 Java 库 提供了即时文件处理、操作和转换。您可以轻松安装此库,无需任何外部依赖项。此外,还有关于其安装和使用的全面文档。 Microsoft Word 文档是当前使用最广泛的文件格式。因此,我们将逐步演示HTML到Word的转换过程。

我们将涵盖以下几点:

使用 Java 将 HTML 转换为 Word - API 安装

这个 Java DOCX 库 提供了大量的特性来加速文件转换过程。它使您可以控制数据和文件操作任务。要在您的 Java 应用程序中启用此库,请下载 jar 文件,或者您可以遵循以下 Maven 配置。

存储库

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

依赖

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

如何以编程方式将网页转换为 Word

以编程方式将 HTML 页面转换为 Word 文档非常简单。您可以通过执行下面提到的几个步骤来实现此功能。

  1. 创建 Document 类的实例并加载源 HTML 文件。
  2. 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式。

将以下代码复制并粘贴到您的 Java 文件中,以将 HTML 文件转换为 Word 文件。

// 创建 Document 类的实例并加载源 HTML 文件
Document document = new Document("index.html");
// 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式
document.save("output.docx", SaveFormat.DOCX);

HTML 到 Word 转换器库 - 高级功能

在本节中,我们将探讨设置文档质量、设置密码等高级功能。

您可以通过以下步骤和代码片段了解更多方法:

  1. 创建 Document 类的实例并加载源 HTML 文件。
  2. protect(int type, java.lang.String password) 方法将使您能够设置密码以保护文档免受任何更改。
  3. unprotect() 将删除密码。
  4. 如果在 Microsoft Word 中编辑此文档时跟踪更改,则将此 setTrackRevisions 方法设置为 True。
  5. 如果 setShowSpellingErrors 方法为 True,则会突出显示拼写错误。
  6. setShowGrammaticalErrors 方法将在 True 时突出显示语法错误。
  7. removeAllChildren 删除当前节点的所有子节点。
  8. 实例化 DocSaveOptions 类的实例。
  9. 调用 setUseHighQualityRendering 方法来设置一个值来确定是否使用高质量(即慢速)渲染算法。 10.调用save(java.lang.String fileName, int saveFormat)方法将文件保存为DOCX格式。
        // 创建 Document 类的实例并加载源 HTML 文件
        Document document = new Document("index.html");
        // Protect(int type, java.lang.String password) 方法将使您能够设置密码以保护文档免受任何更改
        document.protect(1,"password");
        // unprotect() 将删除密码
        document.unprotect();
        // 如果在 Microsoft Word 中编辑此文档时跟踪更改,则将此 setTrackRevisions 方法设置为 True。
        document.setTrackRevisions(true);
        // 如果 setShowSpellingErrors 方法为 True,则会突出显示拼写错误
        document.setShowSpellingErrors(true);
        // 如果为 True,setShowGrammaticalErrors 方法将突出显示语法错误
        document.setShowGrammaticalErrors(true);
        // removeAllChildren 删除当前节点的所有子节点。
        document.removeAllChildren();
        // 实例化 DocSaveOptions 类的实例
        DocSaveOptions opt = new DocSaveOptions();
        // 调用 setUseHighQualityRendering 方法来设置一个值来确定是否使用高质量(即慢速)渲染算法。
        opt.setUseHighQualityRendering(true);
        // 调用 save(java.lang.String fileName, int saveFormat) 方法将文件保存为 DOCX 格式
        document.save("output.docx", SaveFormat.DOCX);

获得免费许可证

您可以获得 免费临时许可证 来试用 API,而不受评估限制。

加起来

这将我们带到这篇博文的结尾。我们已经介绍了如何以编程方式使用 Java 将 HTML 转换为 Word。此外,您可以找到上述部分中提到的功能的代码片段。此外,您可以访问 文档 以了解对您的 HTML 到 Word 转换器有益的其他功能。最后,conholdate.com 正在撰写有关其他主题的新博客文章。因此,请保持联系以获取定期更新。

问一个问题

您可以在我们的 论坛 上分享您的问题或疑问。

也可以看看