Chuyển đổi HTML sang Word bằng Java

Chuyển đổi HTML sang Word bằng Java

Bài đăng trên blog này sẽ hướng dẫn bạn cách chuyển đổi HTML thành Word bằng cách sử dụng Java theo chương trình. May mắn thay, thư viện Java này cung cấp khả năng xử lý, thao tác và chuyển đổi tệp ngay lập tức. Bạn có thể cài đặt thư viện này một cách dễ dàng mà không cần bất kỳ sự phụ thuộc bên ngoài nào. Ngoài ra, còn có tài liệu toàn diện về cách cài đặt và sử dụng nó. Tài liệu Microsoft Word là định dạng tệp được sử dụng rộng rãi nhất hiện nay. Do đó, chúng tôi sẽ trình bày từng bước quá trình chuyển đổi HTML sang Word.

Chúng tôi sẽ đề cập đến các điểm sau:

Chuyển đổi HTML sang Word bằng cách sử dụng cài đặt Java - API

Thư viện Java DOCX này cung cấp rất nhiều tính năng giúp tăng cường quá trình chuyển đổi tệp. Nó cho phép bạn kiểm soát các tác vụ thao tác dữ liệu và tập tin. Để kích hoạt thư viện này trong ứng dụng Java của bạn, tải xuống các tệp jar hoặc bạn có thể làm theo các cấu hình Maven sau.

Kho

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

phụ thuộc

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Cách chuyển đổi WebPage sang Word theo chương trình

Việc chuyển đổi một trang HTML thành tài liệu Word theo chương trình cực kỳ đơn giản. Bạn có thể đạt được chức năng này bằng cách làm theo một số bước được đề cập bên dưới.

  1. Tạo một phiên bản của lớp Document và tải tệp HTML nguồn.
  2. Gọi phương thức save(java.lang.String fileName, int saveFormat) để lưu tệp ở định dạng DOCX.

Sao chép và dán đoạn mã sau vào tệp Java của bạn để chuyển đổi tệp HTML thành tệp Word.

// tạo một thể hiện của lớp Tài liệu và tải tệp HTML nguồn
Document document = new Document("index.html");
// gọi phương thức save(java.lang.String fileName, int saveFormat) để lưu tệp ở định dạng DOCX
document.save("output.docx", SaveFormat.DOCX);

Thư viện chuyển đổi HTML sang Word - Tính năng nâng cao

Trong phần này, chúng ta sẽ khám phá các tính năng nâng cao như cài đặt chất lượng tài liệu, thiết lập mật khẩu, v.v.

Bạn có thể thực hiện các bước sau và đoạn mã để biết về các phương pháp khác:

  1. Tạo một phiên bản của lớp Document và tải tệp HTML nguồn.
  2. Phương thức protect(int type, java.lang.String pass) sẽ cho phép bạn đặt mật khẩu để bảo vệ tài liệu khỏi mọi thay đổi.
  3. unprotect() sẽ xóa mật khẩu.
  4. Đặt phương thức setTrackRevisions này Đúng nếu các thay đổi được theo dõi khi tài liệu này được chỉnh sửa trong Microsoft Word.
  5. Lỗi chính tả sẽ được đánh dấu nếu phương thức setShowSpellingErrors là True.
  6. Phương thức setShowGrammaticalErrors sẽ làm nổi bật các lỗi ngữ pháp nếu Đúng.
  7. removeAllChildren xóa tất cả các nút con của nút hiện tại.
  8. Khởi tạo một thể hiện của lớp DocSaveOptions.
  9. Gọi phương thức setUseHighQualityRendering để đặt giá trị xác định xem có sử dụng thuật toán hiển thị chất lượng cao (tức là chậm) hay không.
  10. Gọi phương thức save(java.lang.String fileName, int saveFormat) để lưu tệp ở định dạng DOCX.
        // tạo một thể hiện của lớp Tài liệu và tải tệp HTML nguồn
        Document document = new Document("index.html");
        // Phương thức Protect(int type, java.lang.String pass) sẽ cho phép bạn đặt mật khẩu để bảo vệ tài liệu khỏi mọi thay đổi
        document.protect(1,"password");
        // unprotect() sẽ xóa mật khẩu
        document.unprotect();
        // đặt phương thức setTrackRevisions này Đúng nếu các thay đổi được theo dõi khi tài liệu này được chỉnh sửa trong Microsoft Word.
        document.setTrackRevisions(true);
        // lỗi chính tả sẽ được đánh dấu nếu phương thức setShowSpellingErrors là True
        document.setShowSpellingErrors(true);
        // Phương thức setShowGrammaticalErrors sẽ làm nổi bật các lỗi ngữ pháp nếu True
        document.setShowGrammaticalErrors(true);
        // RemoveAllChildren xóa tất cả các nút con của nút hiện tại.
        document.removeAllChildren();
        // khởi tạo một thể hiện của lớp DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // gọi phương thức setUseHighQualityRendering để đặt giá trị xác định xem có sử dụng thuật toán hiển thị chất lượng cao (tức là chậm) hay không.
        opt.setUseHighQualityRendering(true);
        // gọi phương thức save(java.lang.String fileName, int saveFormat) để lưu tệp ở định dạng DOCX
        document.save("output.docx", SaveFormat.DOCX);

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử API mà không bị giới hạn về đánh giá.

Tổng hợp

Điều này đưa chúng ta đến phần cuối của bài viết blog này. Chúng tôi đã đề cập đến cách chuyển đổi HTML sang Word bằng cách sử dụng Java theo chương trình. Hơn nữa, bạn có thể tìm thấy các đoạn mã của chức năng được đề cập trong các phần trên. Ngoài ra, bạn có thể truy cập tài liệu để biết các tính năng khác có thể mang lại lợi ích cho trình chuyển đổi HTML sang Word của bạn. Cuối cùng, conholdate.com đang viết bài đăng blog mới về các chủ đề khác. Vì vậy, hãy giữ liên lạc để cập nhật thường xuyên.

Đặt một câu hỏi

Bạn có thể chia sẻ câu hỏi hoặc thắc mắc của mình trên diễn đàn của chúng tôi.

Xem thêm