Chuyển đổi PDF sang Excel

Bạn có thể dễ dàng xuất dữ liệu dạng bảng từ tệp PDF sang trang tính Excel (.xlsx hoặc .xls) theo chương trình trong ứng dụng .NET của mình. Việc chuyển đổi như vậy rất hữu ích khi bạn cần chỉnh sửa dữ liệu hoặc cần áp dụng các phép tính khác nhau có sẵn trong Excel. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi PDF sang Excel bằng C#.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API C# để chuyển đổi PDF sang Excel

Tôi sẽ sử dụng GroupDocs.Conversion for .NET API để chuyển đổi PDF sang XLSX. API này cung cấp giải pháp chuyển đổi tệp nhanh chóng, hiệu quả và đáng tin cậy thành các ứng dụng .NET mà không cần cài đặt bất kỳ phần mềm bên ngoài nào. Nó cũng cho phép bạn xây dựng các ứng dụng chuyển đổi tài liệu mạnh mẽ trong C#, ASP.NET và các công nghệ liên quan đến .NET khác.

Bạn có thể tải xuống DLL của API hoặc cài đặt nó bằng NuGet.

Install-Package GroupDocs.Conversion

Chuyển đổi PDF sang Excel bằng C#

Bạn có thể chuyển đổi tài liệu PDF sang Excel bằng cách thực hiện theo các bước đơn giản dưới đây:

  1. Đặt PdfLoadOptions nếu có.
  2. Đặt tùy chọn chuyển đổi bằng SpreadsheetConvertOptions
  3. Tạo một thể hiện của lớp Converter
  4. Cung cấp đường dẫn tệp và tùy chọn tải
  5. Gọi phương thức Convert cùng với đường dẫn tệp đầu ra và các tùy chọn chuyển đổi

Mẫu mã sau đây cho biết cách xuất dữ liệu dạng bảng từ tệp PDF sang trang tính Excel bằng C#.

// Tùy chọn tải PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions =() => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Tùy chọn chuyển đổi Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Chuyển đổi PDF sang XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Chuyển đổi PDF sang XLSX

Chuyển đổi PDF sang XLSX

Lớp PdfLoadOptions cung cấp nhiều tùy chọn khác nhau để tải tài liệu PDF. [Thuộc tính] này 14 bao gồm FlattenAllFields, HidePdfAnnotations, Mật khẩu và RemoveEmbeddedFiles. Bạn có thể tìm thêm chi tiết trong tài liệu.

Lớp SpreadsheetConvertOptions cung cấp một số thuộc tính nhất định để chuyển đổi tệp từ các định dạng khác sang loại tệp Bảng tính.

  • Thuộc tính PageNumber xác định số trang bắt đầu của tài liệu nguồn cần chuyển đổi.
  • Thuộc tính PagesCount xác định tổng số trang được chuyển đổi bắt đầu từ PageNumber.
  • Bạn có thể chuyển đổi các trang cụ thể bằng cách cung cấp danh sách chỉ mục trang cho thuộc tính Trang.
  • Bạn có thể đặt mật khẩu cho tệp được chuyển đổi bằng thuộc tính Mật khẩu.
  • Thuộc tính Zoom có thể được sử dụng để đặt mức thu phóng theo phần trăm cho tệp được chuyển đổi.
  • Thuộc tính Format xác định định dạng đầu ra của tệp được chuyển đổi.

Bạn có thể tìm thêm thông tin chi tiết về “chuyển đổi sang bảng tính với các tùy chọn nâng cao" trong tài liệu.

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, bạn đã học cách xuất dữ liệu bảng từ tài liệu PDF sang trang tính Excel bằng C#. Bạn có thể tìm hiểu thêm về API GroupDocs.Conversion .NET bằng cách sử dụng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm