تغییر محتوای PDF به صورت برنامهنویسی میتواند در سناریوهایی که اطلاعات حساس یا قدیمی باید قبل از توزیع جایگزین شوند، ضروری باشد. یکی از عملیترین ویژگیها در دستکاری PDF، قابلیت جستجوی یک عبارت یا الگوی خاص و جایگزینی آن با محتوای جایگزین است. در این راهنمای دقیق، ما نشان خواهیم داد که چگونه میتوانید متن را در فایلهای PDF با استفاده از C# پیدا و جایگزین کنید. تمرکز بر روی استفاده از Conholdate.Total قدرتمند برای SDK .NET خواهد بود که به توسعهدهندگان این امکان را میدهد که وظایف دستکاری مستندات را به طور مستحکم انجام دهند، از جمله حذف و جایگزینی با تنها چند خط کد.
ما دو سناریوی مهم را پوشش خواهیم داد. اولین سناریو توضیح خواهد داد که چگونه یک کلمه یا عبارت دقیق را در یک PDF پیدا کرده و آن را جایگزین کنیم. سناریوی دوم به استفاده از عبارات منظم برای مطابقت و جایگزینی الگوهای متغیر مانند شماره تلفنها، شماره حسابها یا سایر فرمتهای داده سفارشی خواهد پرداخت.
چرا متن را در فایلهای PDF پیدا و جایگزین کنیم
اطمینان از حریم خصوصی و رعایت قوانین: به راحتی دادههای شخصی یا محرمانه را قبل از انتشار یا به اشتراکگذاری فایلهای PDF حذف کنید.
اسناد را به طور مؤثر بهروزرسانی کنید: بهطور خودکار اصطلاحات یا محتواهای قدیمی را در میان تعداد زیادی از فایلها جایگزین کنید.
گزینههای جستجوی متن انعطافپذیر: از تطابق دقیق عبارات و عبارات منظم برای پاکسازی جامع استفاده کنید.
حفظ یکپارچگی سند: طراحی و فرمت اصلی را حفظ کنید در حالی که محتوا را جایگزین میکنید.
متن را در PDF با استفاده از C# پیدا و جایگزین کنید - نصب SDK
شما باید Conholdate.Total for .NET را برای پیدا کردن و جایگزینی متن در مدارک PDF پیکربندی کنید. فایل DLL را از بخش نسخههای جدید دانلود کنید یا از دستور نصب NuGet زیر در MS Visual Studio استفاده کنید:
Install-Package Conholdate.Total
یافتن و جایگزینی کلمه در PDF با استفاده از C#
هنگام کار با اسناد PDF که شامل اطلاعات حساس مانند نامها، جزئیات تماس یا شناسههای سازمانی هستند، غالباً نیاز به پاکسازی یا جایگزینی این کلمات قبل از به اشتراکگذاری فایل وجود دارد. Conholdate.Total for .NET SDK راهی ساده برای انجام این کار فراهم میکند. مثال زیر نشان میدهد که چگونه میتوان به دنبال یک تطابق دقیق از یک کلمه یا عبارت گشت و آن را با یک جایگزین یا متن جایگزین کرد.
// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
در این قطعه کد، SDK فایل PDF را برای عبارت "John Doe" اسکن کرده و هر مورد را با واژه "[censored]" جایگزین میکند. این عملیات بهویژه در اتوماسیون حذف اطلاعات شناسایی شخصی از اسناد مفید است. گزینه AddSuffix اطمینان میدهد که فایل اصلی بدون تغییر باقی بماند و نسخه ویرایششده بهعنوان یک فایل جدید ذخیره شود، در حالی که پرچم RasterizeToPDF خروجی را بهصورت یک PDF مبتنی بر متن نگهمیدارد و آن را به تصویر تبدیل نمیکند.
متن را در PDF با عبارات منظم در C# پیدا و جایگزین کنید
گاهی اوقات، متنی که نیاز به جایگزینی در یک PDF دارد، قالب ثابتی ندارد. به عنوان مثال، الگوهایی مانند شمارههای فاکتور، کدهای پستی یا شمارههای شناسایی ممکن است از یک سند به سند دیگر متفاوت باشد. در چنین مواردی، عبارات باقاعده (regular expressions) یک راه حل پویا ارائه میدهند. SDK Conholdate.Total برای .NET به توسعهدهندگان اجازه میدهد تا الگوهای regex را برای شناسایی و جایگزینی ساختارهای متنی پیچیده در یک PDF تعریف کنند.
// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
عبارت منظم استفاده شده در این کد الگوی رایجی را برای کدهای فرمت شده، مانند مرجعهای بانکی یا شناسههای تراکنش مطابقت میدهد. هر متنی که با این الگو همخوانی داشته باشد به طور خودکار شناسایی و با برچسب از پیش تعیین شدهای مانند “[censored]” جایگزین میشود. این سطح از انعطافپذیری اطمینان میدهد که میتوانید اطلاعات حساس را حتی زمانی که نمیدانید محتوای دقیق آن چه بوده، محافظت کنید.
نتیجهگیری
یافتن و جایگزینی متن در اسناد PDF با استفاده از C# هرگز آسانتر نبوده است، به لطف قابلیتهای ارائه شده توسط Conholdate.Total برای .NET. چه در حال جایگزینی یک کلمه خاص باشید و چه در حال جستجوی الگوهای متغیر با عبارات منظم، این SDK اطمینان میدهد که میتوانید محتوای PDF خود را با دقت و کنترل دستکاری کنید. توانایی سانسور اطلاعات حساس، خودکار کردن بهروزرسانیها و حفظ قالببندی سند این ابزار را برای توسعهدهندگان در صنایع مختلف به ابزاری قدرتمند تبدیل میکند. آن را امروز در پروژههای C# خود ادغام کنید و جریانهای کاری پردازش سند خود را با اطمینان ساده کنید.