Chuyển PDF sang Word bằng C#

Chuyển đổi PDF thành văn bản trong Java

Định dạng tệp PDF và MS Word là những định dạng tệp phổ biến và hữu ích nhất ở thời điểm hiện tại. Tài liệu PDF không dễ chỉnh sửa và đôi khi cần có công cụ của bên thứ ba để chỉnh sửa chúng. Trong khi đó, các tệp Word cung cấp rất nhiều lợi ích về mặt này. Tuy nhiên, trong nhiều trường hợp, bạn cần thực hiện chuyển đổi PDF sang Word. Trong bài đăng trên blog này, chúng tôi sẽ sử dụng [thư viện] .NET PDF 3 này để chuyển đổi PDF sang Word bằng C# theo lập trình. Chúng tôi sẽ viết đoạn mã để trình diễn chi tiết chức năng này.

Chúng tôi sẽ đề cập đến các điểm sau:

Cài đặt thư viện .NET PDF

Thư viện C# PDF này là thư viện có thể giúp bạn xây dựng trình chuyển đổi PDF sang Word theo chương trình. Tuy nhiên, bạn có thể tìm thấy một loạt tính năng mạnh mẽ được thư viện này cung cấp. Vì vậy, bạn có thể tải xuống API hoặc cài đặt nó bằng Trình quản lý gói NuGet trong dự án của bạn.

Chuyển PDF sang Word bằng C#

Bạn có thể chuyển đổi tệp PDF thành tài liệu Word bằng cách viết một vài dòng trong ứng dụng .NET.

Bạn có thể làm theo các bước sau và đoạn mã:

  1. Khởi tạo một đối tượng của lớp Document và tải tệp PDF nguồn.
  2. Lưu tệp sang định dạng DOC bằng cách gọi phương thức Save.
// Khởi tạo một đối tượng của lớp Tài liệu và tải tệp PDF nguồn 
Document pdfDocument = new Document( "sample.pdf");
// Lưu tệp sang định dạng DOC bằng cách gọi phương thức Lưu  
pdfDocument.Save( "PDFToDOC_out.doc", SaveFormat.Doc);

Bạn có thể thấy đầu ra trong hình ảnh dưới đây:

chuyển pdf sang word

Chuyển đổi PDF sang Word - tùy chọn nâng cao

Trong phần này, chúng ta sẽ khám phá một số phương pháp nâng cao được cung cấp bởi thư viện C# PDF này.

Vui lòng làm theo các bước và đoạn mã dưới đây:

  1. Mở tài liệu PDF nguồn bằng cách khởi tạo một phiên bản của lớp Tài liệu.
  2. Tạo một phiên bản của lớp DocSaveOptions để truy cập các tùy chọn lưu để xuất sang định dạng Tài liệu.
  3. Đặt giá trị của thuộc tính Format này để lưu tệp đầu ra ở định dạng Doc.
  4. Đặt chế độ nhận dạng là Luồng bằng cách đặt thuộc tính Chế độ.
  5. Gán giá trị cho thuộc tính RelativeHorizontalProximity để đặt Khoảng cách ngang là 2,5.
  6. Bật giá trị để nhận dạng dấu đầu dòng trong quá trình chuyển đổi bằng cách đặt giá trị của thuộc tính RecognizeBullets.
  7. Gọi phương thức Save để lưu tệp vào định dạng tài liệu MS
/ Open the source PDF document by initializing an instance of Document class
Document pdfDocument = new Document( "sample.pdf");
// Tạo một phiên bản của lớp DocSaveOptions để truy cập các tùy chọn lưu để xuất sang định dạng Doc 
DocSaveOptions saveOptions = new DocSaveOptions
{
    // Đặt giá trị của thuộc tính Định dạng này để lưu tệp đầu ra ở định dạng Doc.
    Format = DocSaveOptions.DocFormat.Doc,
    // Đặt chế độ nhận dạng là Luồng bằng cách đặt thuộc tính Chế độ 
    Mode = DocSaveOptions.RecognitionMode.Flow,
    // Gán giá trị cho thuộc tínhRelativeHorizontalProximity Đặt khoảng cách ngang là 2,5 
    RelativeHorizontalProximity = 2.5f,
    // Kích hoạt giá trị để nhận dạng dấu đầu dòng trong quá trình chuyển đổi bằng cách đặt giá trị của thuộc tính Nhận dạngBullets  
    RecognizeBullets = true
};
// Gọi phương thức Save để lưu file vào định dạng tài liệu MS 
pdfDocument.Save( "PDFToDOC_out.doc", saveOptions);

Nhận giấy phép miễn phí

Bạn có thể nhận giấy phép tạm thời miễn phí để dùng thử API mà không bị giới hạn về đánh giá.

Tổng hợp

Chúng tôi có thể kết thúc bài đăng blog này tại đây với hy vọng rằng nó đã cho phép bạn chuyển đổi PDF sang Word bằng C# theo chương trình. Thư viện .NET PDF này chắc chắn sẽ giúp bạn xây dựng trình chuyển đổi PDF sang Word cho ứng dụng kinh doanh của mình. Ngoài ra, bạn có thể truy cập tài liệu của thư viện này để biết thêm các tính năng khác. Cài đặt thư viện này trong dự án .NET của bạn và thực hiện chuyển đổi PDF sang Word theo chương trình. Cuối cùng, hãy duy trì kết nối với conholdate.com để cập nhật thường xuyên.

Đặt một câu hỏi

Bạn có thể cho chúng tôi biết về các câu hỏi hoặc thắc mắc của bạn trên diễn đàn của chúng tôi.

Câu hỏi thường gặp

Làm cách nào để chuyển đổi PDF sang Word trong mạng C#?

Cài đặt [thư viện C# PDF] này 3 để chuyển đổi PDF sang Word theo chương trình. Bạn có thể truy cập tài liệu về cách cài đặt và tính năng của nó.

Làm cách nào bạn có thể chuyển đổi tài liệu PDF sang Word?

Bạn có thể khởi tạo một phiên bản của lớp Tài liệu để tải tệp PDF nguồn và gọi phương thức Save để lưu nó dưới dạng tệp Word.

Xem thêm