Chuyển đổi PDF sang HTML bằng Java

PDF cung cấp tính năng chia sẻ và in các tài liệu chỉ đọc mà không làm mất định dạng tài liệu. Chúng tôi có thể dễ dàng chuyển đổi tài liệu PDF sang các trang web HTML và xem chúng trong bất kỳ trình duyệt nào. Trong bài viết này, chúng ta sẽ tìm hiểu cách chuyển đổi tài liệu PDF sang trang web HTML bằng Java.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API Java để chuyển đổi PDF sang HTML — Tải xuống miễn phí

Để chuyển đổi PDF sang HTML, chúng tôi sẽ sử dụng API GroupDocs.Conversion for Java. Nó cung cấp các giải pháp chuyển đổi tệp nhanh chóng, hiệu quả và đáng tin cậy cho người dùng cuối. Vui lòng tải xuống JAR của API hoặc chỉ cần thêm cấu hình pom.xml sau vào ứng dụng Java dựa trên Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Chuyển đổi PDF sang HTML bằng Java

Chúng ta có thể dễ dàng chuyển đổi tài liệu PDF sang trang web HTML theo lập trình bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Chuyển đổi.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  3. Sau đó, tùy ý thiết lập các tùy chọn chuyển đổi khác nhau như FixedLayout, FixedLayoutShowBorders, v.v.
  4. Cuối cùng, chuyển đổi PDF sang HTML bằng phương thức Converter.Convert(). Nó lấy đường dẫn tệp đầu ra và chuyển đổi các tùy chọn làm đối số.

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF sang trang web HTML bằng Java.

// Ví dụ mã này trình bày cách chuyển đổi tài liệu PDF thành tệp HTML.
// Khởi tạo đối tượng lớp Chuyển thành
Chuyển thànher converter = new Chuyển thànher("C:\\Files\\Conversion\\sample.pdf");

// Xác định các tùy chọn chuyển đổi
MarkupChuyển thànhOptions options = new MarkupChuyển thànhOptions();
options.setFixedLayout(true);

// Chuyển thành
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Chuyển đổi PDF sang HTML bằng Java

Chuyển đổi PDF sang HTML bằng Java.

Chuyển đổi nhiều trang từ PDF sang HTML

Chúng tôi có thể chuyển đổi nhiều trang của tài liệu PDF sang HTML bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Chuyển đổi.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  3. Sau đó, đặt số trang để bắt đầu chuyển đổi.
  4. Sau đó, đặt số trang để chuyển đổi tổng số trang.
  5. Cuối cùng, chuyển đổi PDF sang HTML bằng phương thức Converter.Convert().

Mẫu mã sau đây cho biết cách chuyển đổi nhiều trang từ tài liệu PDF sang tệp HTML bằng Java.

// Ví dụ mã này trình bày cách chuyển đổi nhiều trang PDF thành tệp HTML.
// Khởi tạo đối tượng lớp Chuyển thành
Chuyển thànher converter = new Chuyển thànher("C:\\Files\\Conversion\\sample.pdf");

// Xác định các tùy chọn chuyển đổi
MarkupChuyển thànhOptions options = new MarkupChuyển thànhOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Chuyển thành
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Chuyển đổi các trang cụ thể của PDF sang HTML

Chúng tôi có thể chuyển đổi các trang cụ thể của tài liệu PDF sang HTML bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Chuyển đổi.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  3. Sau đó, cung cấp số trang cụ thể trong danh sách được phân tách bằng dấu phẩy để chuyển đổi.
  4. Cuối cùng, chuyển đổi PDF sang HTML bằng phương thức Converter.Convert().

Mẫu mã sau đây cho biết cách chuyển đổi các trang cụ thể của tài liệu PDF thành tệp HTML bằng Java.

// Ví dụ về mã này trình bày cách chuyển đổi các trang cụ thể của tài liệu PDF thành tệp HTML.
// Khởi tạo đối tượng lớp Chuyển thành
Chuyển thànher converter = new Chuyển thànher("C:\\Files\\Conversion\\sample.pdf");

// Xác định các tùy chọn chuyển đổi
MarkupChuyển thànhOptions options = new MarkupChuyển thànhOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Chuyển thành
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Chuyển đổi PDF được bảo vệ bằng mật khẩu sang HTML trong Java

Chúng tôi cũng có thể chuyển đổi tài liệu PDF được bảo vệ bằng mật khẩu sang trang web HTML bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, cung cấp mật khẩu bằng đối tượng lớp PdfLoadOptions.
  2. Tiếp theo, tải tài liệu PDF bằng lớp Converter với PdfLoadOptions.
  3. Sau đó, tạo một phiên bản của lớp MarkupConvertOptions.
  4. Cuối cùng, chuyển đổi PDF sang HTML bằng phương thức Converter.Convert().

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF được bảo vệ bằng mật khẩu sang tài liệu HTML bằng Java.

// Ví dụ về mã này trình bày cách chuyển đổi PDF được bảo vệ bằng mật khẩu sang HTML.
// Xác định các tùy chọn tải
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Khởi tạo đối tượng lớp Chuyển thành
Chuyển thànher converter = new Chuyển thànher("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Xác định các tùy chọn chuyển đổi
MarkupChuyển thànhOptions options = new MarkupChuyển thànhOptions();

// Chuyển thành
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Chuyển đổi PDF sang HTML bằng hình mờ trong Java

Chúng tôi có thể chuyển đổi tài liệu PDF sang trang web HTML và thêm hình mờ vào các tệp HTML đã chuyển đổi bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Chuyển đổi.
  2. Tiếp theo, tạo một thể hiện của lớp WatermarkOptions.
  3. Sau đó, đặt các tùy chọn khác nhau như Văn bản, Màu sắc, Chiều rộng, Chiều cao, Phông chữ, v.v.
  4. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  5. Sau đó, gán WatermarkOptions cho MarkupConvertOptions.
  6. Cuối cùng, chuyển đổi PDF sang HTML bằng phương thức Converter.Convert().

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF thành tài liệu HTML có hình mờ.

// Ví dụ mã này trình bày cách chuyển đổi PDF sang HTML có hình mờ.
// Khởi tạo đối tượng lớp Chuyển thành
Chuyển thànher converter = new Chuyển thànher("C:\\Files\\Conversion\\sample.pdf");

// Xác định hình mờ 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Xác định các tùy chọn chuyển đổi
MarkupChuyển thànhOptions options = new MarkupChuyển thànhOptions();
options.setWatermark(watermark);

// Đường dẫn tập tin đầu ra
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Chuyển thành
converter.convert(outputFile, options);
Chuyển đổi PDF sang HTML bằng hình mờ trong Java

Chuyển đổi PDF sang HTML bằng hình mờ trong Java.

Nhận giấy phép miễn phí

Vui lòng dùng thử API không có giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, chúng ta đã tìm hiểu cách chuyển đổi tài liệu PDF sang trang web HTML bằng Java. Chúng tôi cũng đã xem cách chuyển đổi tệp PDF được bảo vệ bằng mật khẩu sang HTML và thêm hình mờ vào tệp được chuyển đổi theo chương trình. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Conversion dành cho API Java bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm