使用 Java 将 Word 转换为 Markdown

使用 Java 将 Word 转换为 Markdown

Markdown 语言提供了丰富的功能堆栈并且易于学习。鉴于 MS Word 文档在以维护良好的方式组织和表示业务数据方面一直是一个优势。然而,在快速的应用程序开发中,改变运行时的变化确实很重要。因此,Markdown 文件在商业应用程序开发方面提供了很多帮助。这篇博文将向您展示如何以编程方式使用 Java 将 Word 转换为 Markdown。

我们将介绍以下部分:

Java Docx 库安装

这是一个功能丰富的 ,可让您为 Java 应用程序构建企业级 Word 到 Markdown 转换器。但是,您可以 下载 API 或在基于 Maven 的 Java 应用程序中添加以下配置。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

使用 Java 将 Word 转换为 Markdown

事实上,这个 Java Docx 库公开了许多方法,以编程方式将 Word 文档转换为其他流行的文件和图像格式。

请按照以下步骤和代码段进行操作:

  1. 通过初始化 Document 类的构造函数来加载源 Word 文档。
  2. 通过调用 save 方法将文档保存为 Markdown 格式。

将以下代码复制并粘贴到您的主文件中:

// 通过初始化 Document 类的构造函数来加载源 Word 文档。 
Document doc = new Document("sample.doc");
// 通过调用 save 方法将文档保存为 Markdown 格式。 
doc.save(  "SaveDocx2Markdown.md");

您可以在下图中看到输出:

Word 到 Markdown 转换器

Word 到 Markdown 转换器 - 高级选项

让我们看看这个 Java 库的其他一些突出特性。因此,我们将创建一个包含一些样式的文档并将其保存到 Markdown:

步骤是:

  1. 创建 Document 类的对象。
  2. 实例化 DocumentBuilder 类的一个实例,以使向文档中添加内容更加顺畅。
  3. 通过调用 insertParagraph 方法为段落指定“标题 1”样式。
  4. 调用 setStyleName 方法来设置应用于此格式的段落样式的名称。
  5. 通过调用 write 方法在文档的当前插入位置插入一个字符串。
  6. 通过调用 setItalic 方法将字体格式设置为斜体。
  7. 调用 insertHyperlink 方法将超链接插入到文档中。
  8. 调用 save 方法将您的文档保存为 Markdown 文件。
// 创建 Document 类的对象。 
Document doc = new Document();
// 实例化 DocumentBuilder 类的一个实例,以使向文档中添加内容更加顺畅。
DocumentBuilder builder = new DocumentBuilder(doc);
// 通过调用 insertParagraph 方法为段落指定“标题 1”样式。 
builder.insertParagraph();
// 调用 setStyleName 方法来设置应用于此格式的段落样式的名称。 
builder.getParagraphFormat().setStyleName("Heading 1");
// 通过调用 write 方法将字符串插入到文档的当前插入位置。 
builder.write("Heading 1");
// 指定段落的斜体强调。
builder.insertParagraph();
// 重置上一段的样式以不合并段落之间的样式。
builder.getParagraphFormat().setStyleName("Normal");
// 通过调用 setItalic 方法将字体格式设置为斜体。 
builder.getFont().setItalic(true);
builder.write("Italic Text");
// 重置上一段的样式以不合并段落之间的样式。
builder.setItalic(false);
// 为所需文本指定超链接。
builder.insertParagraph();
// 调用 insertHyperlink 方法将超链接插入到文档中。 
builder.insertHyperlink("Aspose","https://www.aspose.com", false);
builder.write("Aspose");
// 调用 save 方法将文档保存为 Markdown 文件。
doc.save(  "example.md");

输出如下图所示:

给医学博士的话

获得免费许可证

您可以使用 免费临时许可证 来试用 API,而不受评估限制。

加起来

我们可以在这里结束本教程,希望您已经学会了如何使用 Java 以编程方式将 Word 转换为 Markdown。此外,您还了解了这个 Java Docx 库提供的一些高级方法。此外,请不要在没有访问该库的文档 的情况下离开。

此外,我们建议您遵循我们的 入门指南

最后,conholdate.com 正在撰写新的博文。因此,请保持联系以获取定期更新。

问一个问题

您可以在我们的 论坛 上告诉我们您的问题或疑问。

常见问题

如何在 .NET 应用程序中创建 HTML 文档?

通过初始化 Document 类的构造函数来加载源 Word 文档。然后,通过调用 save 方法将文档保存为 Markdown 格式。

也可以看看