Chuyển đổi PDF sang HTML bằng C#

PDF là định dạng phổ biến nhất để chia sẻ và in tài liệu. Trong một số trường hợp nhất định, chúng tôi có thể cần chuyển đổi tài liệu PDF sang trang web HTML. Việc chuyển đổi như vậy giúp chia sẻ nội dung của tài liệu PDF để các bên liên quan có thể xem chúng trên bất kỳ trình duyệt nào một cách dễ dàng. Trong bài viết này, chúng ta sẽ tìm hiểu cách chuyển đổi tài liệu PDF sang trang web HTML bằng C#.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API C# để chuyển đổi PDF sang HTML — Tải xuống miễn phí

Chúng tôi sẽ sử dụng API GroupDocs.Conversion for .NET để chuyển đổi PDF sang HTML. Nó cung cấp các giải pháp chuyển đổi tệp nhanh chóng, hiệu quả và đáng tin cậy cho người dùng cuối. Vui lòng tải xuống DLL của API hoặc cài đặt nó bằng NuGet.

Install-Package GroupDocs.Conversion

Chuyển đổi PDF sang HTML bằng C#

Chúng tôi có thể dễ dàng chuyển đổi tài liệu PDF sang trang web HTML theo chương trình bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Converter với đường dẫn tệp đầu vào làm đối số. Đây là lớp chính kiểm soát quá trình chuyển đổi tài liệu.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions. Nó cung cấp nhiều tùy chọn khác nhau để chuyển đổi sang các loại tệp Đánh dấu.
  3. Sau đó, tùy ý thiết lập các tùy chọn chuyển đổi khác nhau như FixedLayout, FixedLayoutShowBorders, v.v.
  4. Cuối cùng, gọi phương thức Converter.Convert() để lưu tệp HTML đã chuyển đổi. Phương thức này lấy đường dẫn của tệp đầu ra và chuyển đổi các tùy chọn làm đối số.

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF sang trang web HTML bằng C#.

// Tải tệp PDF nguồn
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Đặt tùy chọn chuyển đổi cho định dạng HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Chuyển đổi sang định dạng HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Chuyển đổi PDF sang HTML trong C#.

Chuyển đổi PDF sang HTML trong C#.

Chuyển đổi nhiều trang từ PDF sang HTML

Chúng tôi có thể chuyển đổi nhiều trang của tài liệu PDF sang HTML theo chương trình bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Converter với đường dẫn tệp đầu vào làm đối số.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  3. Sau đó, đặt số trang để bắt đầu chuyển đổi từ
  4. Sau đó, đặt số trang để chuyển đổi tổng số trang
  5. Cuối cùng, gọi phương thức Converter.Convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi để lưu tệp HTML đã chuyển đổi.

Mẫu mã sau đây cho biết cách chuyển đổi nhiều trang từ tài liệu PDF sang tệp HTML trong C#.

// Tải tệp PDF nguồn
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Đặt tùy chọn chuyển đổi cho định dạng HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Chuyển đổi sang định dạng HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Chuyển đổi các trang cụ thể của PDF sang HTML

Chúng tôi có thể chuyển đổi các trang cụ thể của tài liệu PDF sang HTML bằng cách thực hiện theo các bước dưới đây:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Converter với đường dẫn tệp đầu vào làm đối số.
  2. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  3. Sau đó, cung cấp số trang cụ thể trong danh sách được phân tách bằng dấu phẩy để chuyển đổi.
  4. Cuối cùng, gọi phương thức Converter.Convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi để lưu tệp HTML đã chuyển đổi.

Mẫu mã sau đây cho biết cách chuyển đổi các trang cụ thể của tài liệu PDF thành tệp HTML trong C#.

// Tải tệp PDF nguồn
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Đặt tùy chọn chuyển đổi cho định dạng HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Chuyển đổi sang định dạng HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Chuyển đổi PDF sang HTML bằng hình mờ trong C#

Chúng tôi có thể chuyển đổi tài liệu PDF sang trang web HTML và thêm hình mờ vào tệp HTML được chuyển đổi theo chương trình bằng cách thực hiện theo các bước được đưa ra bên dưới:

  1. Đầu tiên, tải tài liệu PDF bằng lớp Converter với đường dẫn tệp đầu vào làm đối số.
  2. Tiếp theo, tạo một thể hiện của lớp WatermarkOptions.
  3. Sau đó, đặt các tùy chọn khác nhau như Văn bản, Màu sắc, Chiều rộng, Chiều cao, Phông chữ, v.v.
  4. Tiếp theo, tạo một phiên bản của lớp MarkupConvertOptions.
  5. Sau đó, gán WatermarkOptions cho MarkupConvertOptions.
  6. Cuối cùng, gọi phương thức Converter.Convert() với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi để lưu tệp HTML đã chuyển đổi.

Mẫu mã sau đây cho biết cách chuyển đổi tài liệu PDF thành tài liệu HTML có hình mờ.

// Tải tệp PDF nguồn
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Xác định hình mờ văn bản
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Đặt tùy chọn chuyển đổi cho định dạng HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Chuyển đổi sang định dạng HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Chuyển đổi PDF sang HTML bằng hình mờ trong C#.

Chuyển đổi PDF sang HTML bằng hình mờ trong C#.

Nhận giấy phép miễn phí

Vui lòng dùng thử API không có giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, chúng ta đã tìm hiểu cách chuyển đổi tài liệu PDF sang trang web HTML trong C#. Chúng tôi cũng đã xem cách chuyển đổi các trang cụ thể của PDF sang HTML và thêm hình mờ vào tệp được chuyển đổi theo chương trình. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Conversion for .NET API bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm