Biên tập lại tài liệu PDF bằng C#

Bạn có thể biên tập lại tài liệu PDF theo chương trình mà không cần cài đặt bất kỳ ứng dụng bên ngoài nào. Là nhà phát triển C#, bạn có thể dễ dàng biên tập lại tài liệu PDF trong ứng dụng .NET của mình. Bài viết này sẽ tập trung vào cách biên tập lại tài liệu PDF bằng C#.

Các chủ đề sau được thảo luận/đề cập trong bài viết này:

API C# để biên tập PDF

Để biên tập trong tài liệu PDF, tôi sẽ sử dụng API GroupDocs.Redaction for .NET. Nó cho phép bạn sắp xếp lại các tệp PDF, Word, Excel, PowerPoint và hình ảnh. Nó cũng cho phép bạn xóa thông tin đã phân loại khỏi hơn 30 loại định dạng được hỗ trợ. Bạn có thể áp dụng nhiều loại biên tập khác nhau như biên tập văn bản, biên tập siêu dữ liệu, biên tập chú thích và biên tập tài liệu dạng bảng.

Bạn có thể tải xuống DLL của API hoặc cài đặt nó bằng NuGet.

Install-Package GroupDocs.Redaction

Biên tập lại văn bản trong PDF bằng C#

Bạn có thể dễ dàng áp dụng tính năng biên tập văn bản trong tài liệu PDF bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Mẫu mã sau đây cho biết cách sắp xếp lại văn bản trong tài liệu PDF bằng C#.

// tạo trình biên tập
Redactor redactor = new Redactor("C:\\Files\\sample.pdf");

// tạo ra sự chỉnh sửa cụm từ chính xác
ExactPhraseRedaction redaction = new ExactPhraseRedaction("John Doe", true, new ReplacementOptions("[personal]"));

// áp dụng biên tập
RedactorChangeLog result = redactor.Apply(redaction);
if (result.Status != RedactionStatus.Failed)
{
    redactor.Save();
};
Biên tập lại văn bản trong PDF bằng C#

Biên tập lại văn bản trong PDF bằng C#

Redactor là lớp chính cung cấp nhiều phương thức khác nhau để thực hiện quy trình biên tập tài liệu. Nó cũng cho phép bạn mở, biên tập lại và lưu tài liệu. Phương thức Apply() của lớp này áp dụng việc chỉnh sửa đã xác định cho tài liệu. Hơn nữa, phương thức Save() của lớp này lưu tài liệu vào một tệp.

ExactPhraseRedaction cung cấp các phương thức thực hiện chỉnh sửa văn bản để thay thế một cụm từ chính xác trong tài liệu. Nó cũng cho phép tìm kiếm dữ liệu phân biệt chữ hoa chữ thường bằng cách đặt IsCaseSensitive thành true.

ReplacementOptions thể hiện các tùy chọn thay thế văn bản phù hợp.

Lớp RedactorChangeLog biểu thị kết quả cho một danh sách các thao tác chỉnh sửa, được truyền cho phương thức Apply() của lớp Redactor.

Biên tập siêu dữ liệu trong PDF bằng C#

Bạn có thể áp dụng biên tập siêu dữ liệu trong tài liệu PDF bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Mẫu mã sau đây cho biết cách sắp xếp lại siêu dữ liệu trong tài liệu PDF bằng C#.

// tạo trình biên tập
Redactor redactor = new Redactor("C:\\Files\\sample.pdf");

// xóa tác giả, người quản lý và công ty
EraseMetadataRedaction redaction = new EraseMetadataRedaction(MetadataFilters.Author | MetadataFilters.Manager | MetadataFilters.Company);

// áp dụng biên tập
redactor.Apply(redaction);
redactor.Save();
Biên tập lại siêu dữ liệu trong PDF bằng C#

Biên tập lại siêu dữ liệu trong PDF bằng C#

Lớp EraseMetadataRedaction cung cấp các phương thức để xóa tất cả siêu dữ liệu. Nó cũng cho phép xóa siêu dữ liệu phù hợp với các Bộ lọc siêu dữ liệu cụ thể khỏi tài liệu.

Bộ lọc siêu dữ liệu là danh sách các loại siêu dữ liệu tài liệu phổ biến nhất như Tác giả, Nhận xét, Công ty.

Biên tập lại hình ảnh trong PDF bằng C#

Bạn có thể áp dụng tính năng chỉnh sửa hình ảnh trong tài liệu PDF bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Mẫu mã sau đây cho biết cách sắp xếp lại hình ảnh trong tài liệu PDF bằng C#.

// tạo trình biên tập
Redactor redactor = new Redactor("C:\\Files\\sample_with_images.pdf");

// xác định kích thước và điểm
System.Drawing.Point samplePoint = new System.Drawing.Point(0, 0);
System.Drawing.Size sampleSize = new System.Drawing.Size(300, 240);

// xác định biên tập vùng hình ảnh
ImageAreaRedaction redaction = new ImageAreaRedaction(samplePoint,
             new RegionReplacementOptions(System.Drawing.Color.Blue, sampleSize));

// áp dụng biên tập
RedactorChangeLog result = redactor.Apply(redaction);

if (result.Status != RedactionStatus.Failed)
{
    redactor.Save();
};
Biên tập lại hình ảnh trong PDF bằng C#

Biên tập lại hình ảnh trong PDF bằng C#

Lớp ImageAreaRedaction cho phép đặt một hình chữ nhật màu trong khu vực nhất định của tài liệu hình ảnh.

Lớp RegionReplacementOption biểu thị các tham số màu và vùng cho vùng được thay thế bằng hình ảnh.

Áp dụng nhiều giao diện trong PDF bằng C#

Bạn có thể áp dụng nhiều thao tác chỉnh sửa trong tài liệu PDF bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Mẫu mã sau đây cho biết cách áp dụng nhiều thao tác chỉnh sửa trong tài liệu PDF bằng C#.

// tạo trình biên tập
Redactor redactor = new Redactor("C:\\Files\\sample.pdf");

// xác định nhiều lần chỉnh sửa
var redactionList = new Redaction[]
{
    new ExactPhraseRedaction("John Doe", new ReplacementOptions("[Client]")),
    new RegexRedaction("Redaction", new ReplacementOptions("[Product]")),
    new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(System.Drawing.Color.Blue)),
    new EraseMetadataRedaction(MetadataFilters.All)
};

// áp dụng các biên tập
RedactorChangeLog result = redactor.Apply(redactionList);

// lưu nếu áp dụng nếu không sẽ hiển thị lỗi
if (result.Status == RedactionStatus.Applied)
{
    redactor.Save();
}
else if (result.Status == RedactionStatus.Failed)
{
   for (int i = 0; i < result.RedactionLog.Count; i++)
    {
        RedactorLogEntry logEntry = result.RedactionLog[i];
        if (logEntry.Result.Status != RedactionStatus.Applied)
        {
            Console.WriteLine("{0} status is {1}, details: {2}",
                logEntry.Redaction.GetType().Name,
                logEntry.Result.Status,
                logEntry.Result.ErrorMessage);
        }
    }
};
Áp dụng nhiều giao diện trong PDF bằng C#

Áp dụng nhiều giao diện trong PDF bằng C#

Lớp RegexRedaction cho phép thực hiện chỉnh sửa văn bản. Bạn có thể tìm kiếm và thay thế bất kỳ văn bản nào trong tài liệu bằng cách khớp văn bản bằng biểu thức chính quy.

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không bị giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Phần kết luận

Trong bài viết này, bạn đã học cách biên tập tài liệu PDF bằng C#. Bạn cũng đã học cách sắp xếp lại Văn bản, Siêu dữ liệu và Hình ảnh trong tài liệu PDF. Hơn nữa, bạn đã học cách áp dụng nhiều thao tác chỉnh sửa trong PDF bằng C#. Bạn có thể tìm hiểu thêm về GroupDocs.Redaction cho .NET API bằng tài liệu. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm