Chuyển đổi HTML sang PDF bằng Java

Là nhà phát triển Java, bạn có thể dễ dàng chuyển đổi tệp HTML hoặc trang web từ URL web trực tiếp thành tài liệu PDF theo chương trình trong ứng dụng Java của mình. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi HTML sang PDF bằng Java.

Các chủ đề sau được thảo luận/đề cập trong bài viết này:

API Java chuyển đổi HTML sang PDF

Để chuyển đổi HTML thành PDF, tôi sẽ sử dụng GroupDocs.Conversion for Java API. Đây là giải pháp chuyển đổi tệp nhanh chóng, hiệu quả và đáng tin cậy cho các ứng dụng Java của bạn mà không cần cài đặt bất kỳ phần mềm bên ngoài nào. Bạn có thể chuyển đổi giữa tất cả các định dạng tài liệu kinh doanh phổ biến như PDF, HTML, Email, Word, Excel, PowerPoint, Project, định dạng tệp hình ảnh raster, v.v. Nó cũng cho phép bạn hiển thị toàn bộ tài liệu hoặc hiển thị một phần để tăng tốc quá trình. API tương thích với tất cả các phiên bản Java và hỗ trợ các hệ điều hành phổ biến (Windows, Linux, macOS) có khả năng chạy thời gian chạy Java.

Bạn có thể tải xuống JAR của API hoặc chỉ cần thêm cấu hình pom.xml sau vào ứng dụng Java dựa trên Maven của bạn để thử các ví dụ mã được đề cập bên dưới.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
  <groupId>com.groupdocs</groupId>
  <artifactId>groupdocs-conversion</artifactId>
  <version>21.7</version> 
</dependency>

Chuyển đổi HTML sang PDF bằng Java

Bạn có thể dễ dàng chuyển đổi tệp HTML thành tài liệu PDF bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Tạo một thể hiện của lớp Converter với đường dẫn tệp đầu vào
  2. Tạo một phiên bản của PdfConvertOptions
  3. Gọi phương thức convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu HTML thành tài liệu PDF bằng Java.

// khởi tạo trình chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample.html");

// xác định các tùy chọn chuyển đổi PDF
PdfConvertOptions options = new PdfConvertOptions();

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\HtmlToPdf.pdf", options);
Chuyển đổi HTML sang PDF bằng Java

Chuyển đổi HTML sang PDF bằng Java

Lớp Converter là lớp chính kiểm soát quá trình chuyển đổi tài liệu. Nó cung cấp các phương pháp khác nhau để thực hiện các yêu cầu chuyển đổi. Phương thức convert() của lớp này chuyển đổi tài liệu nguồn sang định dạng đích đã chỉ định và lưu tài liệu đã chuyển đổi tại đường dẫn tệp đã cho. Nó cung cấp một số phương thức Convert() quá tải để chuyển đổi các định dạng tệp được hỗ trợ.

Chuyển đổi HTML sang PDF với Tùy chọn nâng cao

Bạn có thể sử dụng một số cài đặt nâng cao trong khi chuyển đổi tệp HTML sang tài liệu PDF bằng cách thực hiện theo các bước dưới đây:

  1. Tạo một thể hiện của lớp Converter với đường dẫn tệp đầu vào
  2. Tạo một phiên bản của PdfConvertOptions
  3. Đặt nhiều tùy chọn khác nhau như Xoay, Dpi, Chiều rộng, Chiều cao, v.v.
  4. Gọi phương thức convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi tệp HTML thành tài liệu PDF với cài đặt nâng cao.

// khởi tạo trình chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample.html");

// xác định PdfConvertOptions
PdfConvertOptions options = new PdfConvertOptions();
options.setPassword("12345");
options.setRotate(Rotation.On180);
options.setDpi(300);
options.setWidth(1024);
options.setHeight(768);

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\ConvertWithAdvancedOptions.pdf", options);
Chuyển đổi HTML sang PDF với Tùy chọn nâng cao bằng Java

Chuyển đổi HTML sang PDF với Tùy chọn nâng cao bằng Java

Lớp PdfConvertOptions cung cấp một số tùy chọn để chuyển đổi các tệp đầu vào được chỉ định thành tài liệu PDF. Tôi đã sử dụng các tùy chọn sau:

  • Chiều rộng — the setWidth() property sets the image width after conversion
  • Chiều cao — the setHeight() property sets the desired image height after conversion
  • dpi — the setDpi() property sets the desired page DPI after conversion
  • Mật khẩu — the setPassword() property protects the converted document with a password
  • Quay — the setRotate() property allows page rotation with the following available options: None, On90, On180, On270

Bạn có thể tìm thêm thông tin chi tiết về “Chuyển sang PDF với Tùy chọn nâng cao" trong tài liệu.

Chuyển đổi HTML sang PDF từ một URL

Bạn có thể chuyển đổi các trang web HTML từ URL trực tiếp sang tài liệu PDF bằng cách thực hiện theo các bước dưới đây:

  1. Cung cấp URL cho đối tượng luồng đầu vào và mở luồng
  2. Tạo một thể hiện của lớp Converter với đối tượng luồng đầu vào
  3. Tạo một phiên bản của PdfConvertOptions
  4. Gọi phương thức convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi HTML từ URL web sang tài liệu PDF bằng Java.

// luồng đầu vào
InputStream stream = new URL("https://onlinebooks.library.upenn.edu/readers.html").openStream();

// khởi tạo trình chuyển đổi
Converter chuyển thànher = new Converter(stream);

// xác định các tùy chọn chuyển đổi PDF
PdfConvertOptions options = new PdfConvertOptions();

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\LoadDocumentFromUrl.pdf", options);

Chuyển đổi phạm vi trang cụ thể của HTML sang PDF

Bạn có thể chuyển đổi các trang cụ thể từ tài liệu HTML nhiều trang sang tài liệu PDF bằng cách thực hiện theo các bước dưới đây:

  1. Tạo một thể hiện của lớp Converter với đường dẫn tệp đầu vào
  2. Tạo một phiên bản của PdfConvertOptions
  3. Đặt số trang để bắt đầu chuyển đổi từ
  4. Đặt số trang để chuyển đổi tổng số trang
  5. Gọi phương thức convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi các trang cụ thể từ HTML sang tài liệu PDF bằng Java.

// khởi tạo trình chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\Conversion\\sample_2.html");

// xác định PdfConvertOptions
PdfConvertOptions options = new PdfConvertOptions();
options.setPageNumber(2);
options.setPagesCount(1);

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\ConvertNConsecutivePages.pdf", options);

Chuyển đổi HTML sang PDF và thêm hình mờ

Bạn có thể chuyển đổi tệp HTML thành tài liệu PDF có hình mờ bằng cách thực hiện theo các bước dưới đây:

  1. Tạo một thể hiện của lớp Converter
  2. Cung cấp đường dẫn tệp đầu vào cho hàm tạo
  3. Tạo một phiên bản của PdfConvertOptions
  4. Tạo một phiên bản của WatermarkOptions
  5. Đặt nhiều tùy chọn khác nhau như Văn bản, Màu sắc, Chiều rộng, Chiều cao, Góc xoay, v.v.
  6. Gọi phương thức convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu HTML thành tài liệu PDF có hình mờ bằng Java.

// khởi tạo trình chuyển đổi
Converter chuyển thànher = new Converter("C:\\Files\\sample_2.html");

// xác định các tùy chọn chuyển đổi PDF
PdfConvertOptions options = new PdfConvertOptions();

// xác định các tùy chọn hình mờ
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("THIS IS A SAMPLE TEXT WATERMARK");
watermark.setColor(Color.red);
watermark.setTop(400);
watermark.setLeft(150);
watermark.getWatermarkFont().setBold(true);
watermark.setRotationAngle(30);
watermark.setWidth(1000);
watermark.setHeight(1000);
watermark.setBackground(false);
options.setWatermark(watermark);

// chuyển thành
chuyển thànher.chuyển thành("C:\\Files\\HtmlToPDFAddWatermark.pdf", options);
Chuyển đổi HTML sang PDF và thêm hình mờ bằng Java

Chuyển đổi HTML sang PDF và thêm hình mờ bằng Java

Lớp WatermarkOptions cung cấp một số tùy chọn để thêm hình mờ vào tài liệu đã chuyển đổi. Nó cho phép bạn thêm hình mờ văn bản hoặc hình ảnh vào tài liệu đã chuyển đổi.

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, bạn đã học cách chuyển đổi tài liệu HTML sang PDF bằng Java. Bạn cũng đã học cách thêm hình mờ vào tài liệu PDF đã chuyển đổi. Hơn nữa, bạn đã học cách chuyển đổi HTML bằng các tùy chọn chuyển đổi PDF nâng cao theo chương trình. Bài viết này cũng giải thích cách chuyển đổi các trang web HTML từ URL trực tiếp sang tài liệu PDF bằng Java. Bạn có thể tìm hiểu thêm về API Java GroupDocs.Conversion bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm