Chỉnh sửa Word DOCX bằng Java

Bạn có thể chỉnh sửa theo chương trình tất cả các định dạng tài liệu xử lý Word như DOC, DOCX hoặc DOTM một cách dễ dàng. Là nhà phát triển Java, bạn có thể chỉnh sửa tài liệu Word trong ứng dụng Java của mình. Trong bài viết này, bạn sẽ tìm hiểu cách chỉnh sửa tài liệu word bằng Java.

Các chủ đề sau được thảo luận/đề cập trong bài viết này:

API Java để chỉnh sửa tài liệu Word

Để chỉnh sửa tệp DOCX, tôi sẽ sử dụng API GroupDocs.Editor for Java. Nó cho phép bạn chỉnh sửa theo chương trình các tài liệu xử lý Word, trang tính Excel hoặc tài liệu ở các định dạng được hỗ trợ khác. API cho phép bạn tải tài liệu và chuyển đổi chúng thành HTML. Nó cung cấp HTML cho giao diện người dùng bên ngoài để chỉnh sửa và sau đó lưu HTML vào tài liệu gốc sau khi thao tác.

Bạn có thể tải xuống JAR của API hoặc chỉ cần thêm cấu hình pom.xml sau vào các ứng dụng Java dựa trên Maven của bạn để thử các ví dụ mã được đề cập bên dưới.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-editor</artifactId>
        <version>20.11.0</version> 
</dependency>

Chỉnh sửa tài liệu Word bằng Java

Bạn có thể dễ dàng chỉnh sửa tài liệu Word theo chương trình bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

  • Xác định WordProcessingLoadOptions
  • Tạo một thể hiện của lớp Editor
  • Chỉ định đường dẫn đến tệp DOCX đầu vào
  • Xác định WordProcessingEditOptions
  • Gọi phương thức edit() và lấy đối tượng EditableDocument
  • Lấy nội dung tài liệu và các tài nguyên liên quan từ EditableDocument
  • Gọi phương thức getEmbeddedHtml() để lấy tài liệu dưới dạng một Chuỗi được mã hóa base64
  • Cập nhật nội dung bằng cách gọi phương thức thay thế()
  • Gọi phương thức fromMarkup() và tạo một phiên bản EditableDocument mới
  • Xác định WordProcessingSaveOptions
  • Gọi phương thức save() và lưu tệp đã cập nhật
  • Vứt bỏ đồ vật

Mẫu mã sau đây cho biết cách chỉnh sửa tệp DOCX bằng Java.

//Tập tin đầu vào
String inputFilePath = "C:\\Files\\Sample.docx";

//Tải tài liệu với các tùy chọn tải
WordProcessingLoadOptions wordLoadOptions = new WordProcessingLoadOptions();
wordLoadOptions.setPassword("some password"); // Password if required
Editor editor = new Editor(inputFilePath, wordLoadOptions);

// Chỉ định tùy chọn chỉnh sửa
WordProcessingEditOptions editOptions = new WordProcessingEditOptions();
editOptions.setEnableLanguageInformation(true);
editOptions.setEnablePagination(true);

//Mở tài liệu đầu vào để chỉnh sửa
EditableDocument beforeEdit = editor.edit(editOptions);

//Lấy nội dung tài liệu và các tài nguyên liên quan từ tài liệu có thể chỉnh sửa
String content = beforeEdit.getContent();
List<IImageResource> images = beforeEdit.getImages();
List<FontResourceBase> fonts = beforeEdit.getFonts();
List<CssText> stylesheets = beforeEdit.getCss();

//Nhận tài liệu dưới dạng một Chuỗi được mã hóa base64, trong đó tất cả tài nguyên (hình ảnh, phông chữ, v.v.) được nhúng bên trong Chuỗi này cùng với nội dung văn bản chính
String allEmbeddedInsideString = beforeEdit.getEmbeddedHtml();
//Chỉnh sửa nội dung
String allEmbeddedInsideStringEdited = allEmbeddedInsideString.replace("Subtitle", "Edited subtitle");

//Tạo một phiên bản EditableDocument mới từ nội dung và tài nguyên đã chỉnh sửa
EditableDocument afterEdit = EditableDocument.fromMarkup(allEmbeddedInsideStringEdited, null);

//đường dẫn tài liệu đầu ra
String outputPath = "C:\\Files\\Sample_output.docx";
//Lưu tùy chọn
WordProcessingSaveOptions saveOptions = new WordProcessingSaveOptions(WordProcessingFormats.Docx);
//Cuối cùng lưu vào đường dẫn
editor.save(afterEdit, outputPath, saveOptions);

//Vứt bỏ đồ vật
beforeEdit.dispose();
afterEdit.dispose();
editor.dispose();
Chỉnh sửa tài liệu Word bằng Java

Chỉnh sửa tài liệu Word bằng Java

Lớp WordprocessingLoadOptions cung cấp nhiều tùy chọn khác nhau để tải các tài liệu Word như DOC, DOCX, RTF, ODT, v.v. vào lớp Editor.

  • Phương thức setPassword cho phép chỉ định mật khẩu để mở tài liệu được bảo vệ bằng mật khẩu.

Lớp Editor là lớp chính cung cấp các phương thức tải, chỉnh sửa và lưu tài liệu ở tất cả các định dạng có thể hỗ trợ.

Lớp WordProcesingEditOptions cho phép bạn chỉ định các tùy chọn tùy chỉnh để mở tài liệu xử lý Word để chỉnh sửa.

  • Phương thức setEnabledLanguageInformation chỉ định xem thông tin ngôn ngữ có được xuất sang đánh dấu HTML dưới dạng thuộc tính HTML ’lang’ hay không.
  • Phương thức setEnablePagination cho phép bật hoặc tắt tính năng phân trang trong tài liệu HTML kết quả.

Lớp EditableDocument lưu trữ nội bộ tài liệu và cung cấp các phương thức để tạo đánh dấu HTML và tạo tài nguyên.

Lớp WordProcessingSaveOptions cung cấp các tùy chọn tùy chỉnh để tạo và lưu tài liệu Word sau khi chỉnh sửa.

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, bạn đã học cách chỉnh sửa tài liệu Word bằng Java. Bạn có thể tìm hiểu thêm về GroupDocs.Editor dành cho API Java bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm