Chuyển đổi Word sang Markdown bằng Java

Chuyển đổi Word sang Markdown bằng Java

Ngôn ngữ Markdown cung cấp nhiều tính năng phong phú và dễ học. Trong khi đó, tài liệu MS Word luôn là điểm cộng trong việc tổ chức và trình bày dữ liệu kinh doanh một cách được bảo trì tốt. Tuy nhiên, trong quá trình phát triển ứng dụng nhanh chóng, điều thực sự quan trọng là phải thay đổi những thay đổi trong thời gian chạy. Do đó, các tệp đánh dấu mang lại rất nhiều lợi ích khi phát triển ứng dụng kinh doanh. Bài đăng trên blog này sẽ chỉ cho bạn cách chuyển đổi Word sang Markdown bằng cách sử dụng Java theo chương trình.

Chúng tôi sẽ đề cập đến các phần sau:

Cài đặt thư viện Java Docx

Đây là thư viện có nhiều tính năng cho phép bạn xây dựng trình chuyển đổi Word sang Markdown cấp doanh nghiệp cho ứng dụng Java của mình. Tuy nhiên, bạn có thể tải xuống API hoặc chỉ cần thêm cấu hình sau vào các ứng dụng Java dựa trên Maven của mình.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Chuyển đổi Word sang Markdown bằng Java

Trên thực tế, có rất nhiều phương pháp được thư viện Java Docx này đưa ra để chuyển đổi tài liệu Word sang các định dạng tệp và hình ảnh phổ biến khác theo chương trình.

Vui lòng làm theo các bước và đoạn mã được đề cập bên dưới:

  1. Tải tài liệu Word nguồn bằng cách khởi tạo hàm tạo của lớp Tài liệu.
  2. Lưu tài liệu sang định dạng Markdown bằng cách gọi phương thức save.

Sao chép và dán đoạn mã sau vào tệp chính của bạn:

// Tải tài liệu Word nguồn bằng cách khởi tạo hàm tạo của lớp Tài liệu. 
Document doc = new Document("sample.doc");
// Lưu tài liệu sang định dạng Markdown bằng cách gọi phương thức lưu. 
doc.save(  "SaveDocx2Markdown.md");

Bạn có thể thấy đầu ra trong hình ảnh dưới đây:

Công cụ chuyển đổi Word sang Markdown

Công cụ chuyển đổi Word sang Markdown - tùy chọn nâng cao

Hãy cùng xem một số tính năng nổi bật khác của thư viện Java này. Vì vậy, chúng tôi sẽ tạo một tài liệu với một số kiểu và lưu nó vào Markdown:

Các bước là:

  1. Tạo một đối tượng của lớp Document.
  2. Khởi tạo một thể hiện của lớp DocumentBuilder để giúp việc thêm nội dung vào tài liệu trở nên suôn sẻ.
  3. Chỉ định kiểu “Tiêu đề 1” cho đoạn văn bằng cách gọi phương thức insertParagraph.
  4. Gọi phương thức setStyleName để đặt tên kiểu đoạn văn được áp dụng cho định dạng này.
  5. Chèn một chuỗi vào tài liệu tại vị trí chèn hiện tại bằng cách gọi phương thức write.
  6. Tạo định dạng phông chữ in nghiêng bằng cách gọi phương thức setItalic.
  7. Gọi phương thức insertHyperlink để chèn siêu liên kết vào tài liệu.
  8. Gọi phương thức save để lưu tài liệu của bạn dưới dạng tệp Markdown.
// Tạo một đối tượng của lớp Tài liệu. 
Document doc = new Document();
// Khởi tạo một phiên bản của lớp DocumentBuilder để giúp việc thêm nội dung vào tài liệu trở nên dễ dàng hơn.
DocumentBuilder builder = new DocumentBuilder(doc);
// Chỉ định kiểu "Tiêu đề 1" cho đoạn văn bằng cách gọi phương thức InsertParagraph. 
builder.insertParagraph();
// Gọi phương thức setStyleName để đặt tên kiểu đoạn văn được áp dụng cho định dạng này. 
builder.getParagraphFormat().setStyleName("Heading 1");
// Chèn một chuỗi vào tài liệu ở vị trí chèn hiện tại bằng cách gọi phương thức ghi. 
builder.write("Heading 1");
// Chỉ định nhấn mạnh kiểu nghiêng cho đoạn văn.
builder.insertParagraph();
// Đặt lại kiểu từ đoạn trước để không kết hợp kiểu giữa các đoạn.
builder.getParagraphFormat().setStyleName("Normal");
// Tạo định dạng phông chữ nghiêng bằng cách gọi phương thức setItalic. 
builder.getFont().setItalic(true);
builder.write("Italic Text");
// Đặt lại kiểu từ đoạn trước để không kết hợp kiểu giữa các đoạn.
builder.setItalic(false);
// Chỉ định một siêu liên kết cho văn bản mong muốn.
builder.insertParagraph();
// Gọi phương thức InsertHyperlink để chèn siêu liên kết vào tài liệu. 
builder.insertHyperlink("Aspose","https://www.aspose.com", false);
builder.write("Aspose");
// Gọi phương thức lưu để lưu tài liệu của bạn dưới dạng tệp Markdown.
doc.save(  "example.md");

Đầu ra được hiển thị trong hình ảnh dưới đây:

Lời tới MD

Nhận giấy phép miễn phí

Bạn có thể tận dụng giấy phép tạm thời miễn phí để dùng thử API mà không bị giới hạn về đánh giá.

Tổng hợp

Chúng tôi có thể kết thúc hướng dẫn này ở đây với hy vọng bạn đã học được cách chuyển đổi Word sang Markdown bằng cách sử dụng Java theo chương trình. Ngoài ra, bạn cũng đã tìm hiểu qua một số phương pháp nâng cao được cung cấp bởi thư viện Java Docx này. Hơn nữa, xin đừng rời đi mà chưa ghé thăm tài liệu của thư viện này.

Hơn nữa, chúng tôi khuyên bạn nên làm theo Hướng dẫn bắt đầu của chúng tôi.

Cuối cùng, conholdate.com đang viết bài blog mới. Vì vậy, hãy giữ liên lạc để cập nhật thường xuyên.

Đặt một câu hỏi

Bạn có thể cho chúng tôi biết về các câu hỏi hoặc thắc mắc của bạn trên diễn đàn của chúng tôi.

Câu hỏi thường gặp

Làm cách nào để tạo tài liệu HTML trong ứng dụng .NET?

Tải tài liệu Word nguồn bằng cách khởi tạo hàm tạo của lớp Tài liệu. Sau đó, lưu tài liệu sang định dạng Markdown bằng cách gọi phương thức save.

Xem thêm