Chuyển đổi PDF sang Word bằng Java

Bạn có thể dễ dàng chuyển đổi tài liệu PDF thành tài liệu Word (.docx hoặc .doc) theo chương trình trong các ứng dụng Java của mình. Việc chuyển đổi như vậy rất hữu ích khi bạn cần chỉnh sửa văn bản của tài liệu PDF hoặc có thể cần áp dụng định dạng văn bản. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi PDF sang Word bằng Java.

Các chủ đề sau được thảo luận/đề cập trong bài viết này:

API Java để chuyển đổi PDF sang Word

Tôi sẽ sử dụng GroupDocs.Conversion for Java API để chuyển đổi PDF sang DOCX. API này cung cấp giải pháp chuyển đổi tệp nhanh chóng, hiệu quả và đáng tin cậy sang các ứng dụng Java mà không cần cài đặt bất kỳ phần mềm bên ngoài nào. Nó hỗ trợ chuyển đổi giữa tất cả các định dạng tài liệu kinh doanh phổ biến như PDF, HTML, Email, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, định dạng tệp hình ảnh raster và nhiều định dạng khác. Nó cũng cho phép bạn hiển thị toàn bộ tài liệu hoặc hiển thị một phần để tăng tốc quá trình. API tương thích với tất cả các phiên bản Java và hỗ trợ các hệ điều hành phổ biến (Windows, Linux, macOS) có khả năng chạy thời gian chạy Java.

Tải xuống và cấu hình

Bạn có thể tải xuống JAR của API hoặc chỉ cần thêm cấu hình pom.xml sau vào ứng dụng Java dựa trên Maven của bạn để thử các ví dụ mã được đề cập bên dưới.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Chuyển đổi PDF sang Word bằng Java

Bạn có thể chuyển đổi tài liệu PDF sang Word bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Tạo một thể hiện của lớp Converter
  2. Cung cấp đường dẫn tệp đầu vào
  3. Tạo một phiên bản của WordProcessingConvertOptions
  4. Đặt số trang bắt đầu
  5. Cung cấp tổng số trang để chuyển đổi
  6. Đặt định dạng tệp đầu ra
  7. Gọi phương thức Convert() cùng với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi tệp PDF thành tài liệu Word bằng Java.

// tạo bộ chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample.pdf");

// đặt tùy chọn chuyển đổi Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\output.docx", options);
Chuyển đổi PDF sang Word bằng Java

Chuyển đổi PDF sang Word bằng Java

Lớp Converter là lớp chính kiểm soát quá trình chuyển đổi tài liệu. Nó cung cấp nhiều phương pháp khác nhau để chuyển đổi tài liệu ở các định dạng tệp được hỗ trợ. Phương thức Convert() của lớp này chuyển đổi tài liệu nguồn và lấy hai tham số đầu vào, đường dẫn tệp đến tài liệu nguồn và ConvertOptions để chuyển đổi một tài liệu nguồn cụ thể sang loại tệp đích mong muốn.

Lớp WordProcessingConvertOptions cung cấp các tùy chọn để chuyển đổi sang loại tệp WordProcessing. Phương thức setPageNumber() cho phép thiết lập số trang bắt đầu để bắt đầu chuyển đổi. Trong khi đó, phương thức setPagesCount() xác định tổng số trang được chuyển đổi bắt đầu từ số trang đã xác định. Phương thức setFormat() của lớp này cho phép bạn đặt định dạng đầu ra của tài liệu được chuyển đổi. Nó lấy kiểu liệt kê WordProcessingFileType làm đầu vào.

Chuyển đổi các trang cụ thể của PDF sang Word

Bạn có thể chuyển đổi các trang cụ thể của tài liệu PDF sang Word bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Tạo một thể hiện của lớp Converter
  2. Cung cấp đường dẫn tệp đầu vào
  3. Tạo một phiên bản của WordProcessingConvertOptions
  4. Đặt danh sách số trang để chuyển đổi
  5. Gọi phương thức Convert() cùng với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi các trang cụ thể từ tệp PDF thành tài liệu Word bằng Java.

// tạo bộ chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample.pdf");

// xác định các tùy chọn chuyển đổi Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\output.docx", options);

Lớp WordProcessingConvertOptions cung cấp phương thức setPages() để chuyển đổi số trang cụ thể được xác định trong danh sách được phân tách bằng dấu phẩy từ tài liệu nguồn.

Tải PDF được bảo vệ bằng mật khẩu và chuyển đổi sang Word

Bạn có thể chuyển đổi tài liệu PDF được bảo vệ bằng mật khẩu sang Word bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Tạo PdfLoadOptions
  2. Đặt mật khẩu
  3. Tạo một thể hiện của lớp Converter
  4. Cung cấp đường dẫn tệp đầu vào
  5. Tạo một phiên bản của WordProcessingConvertOptions
  6. Gọi phương thức Convert() cùng với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi tệp PDF được bảo vệ bằng mật khẩu thành tài liệu Word bằng Java.

// Tùy chọn tải PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// tạo bộ chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample.pdf", loadOptions);

// xác định các tùy chọn chuyển đổi Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\output.docx", options);

Lớp PdfLoadOptions cung cấp nhiều tùy chọn khác nhau để tải tài liệu PDF. Phương thức setPassword() của lớp này cho phép bạn bỏ bảo vệ tài liệu được bảo vệ bằng cách cung cấp mật khẩu của nó.

Bạn có thể tìm thêm thông tin chi tiết về “Tải tài liệu PDF có tùy chọn" trong tài liệu.

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tài liệu PDF sang Word bằng Java. Bạn cũng đã học cách chuyển đổi tệp PDF được bảo vệ bằng mật khẩu sang tài liệu Word. Hơn nữa, bạn đã học cách chuyển đổi các trang cụ thể từ PDF sang tài liệu Word theo chương trình. Bạn có thể tìm hiểu thêm về API Java GroupDocs.Conversion bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm