تغییر محتوای PDF به صورت برنامه‌نویسی می‌تواند در سناریوهایی که اطلاعات حساس یا قدیمی باید قبل از توزیع جایگزین شوند، ضروری باشد. یکی از عملی‌ترین ویژگی‌ها در دستکاری PDF، قابلیت جستجوی یک عبارت یا الگوی خاص و جایگزینی آن با محتوای جایگزین است. در این راهنمای دقیق، ما نشان خواهیم داد که چگونه می‌توانید متن را در فایل‌های PDF با استفاده از C# پیدا و جایگزین کنید. تمرکز بر روی استفاده از Conholdate.Total قدرتمند برای SDK .NET خواهد بود که به توسعه‌دهندگان این امکان را می‌دهد که وظایف دستکاری مستندات را به طور مستحکم انجام دهند، از جمله حذف و جایگزینی با تنها چند خط کد.

ما دو سناریوی مهم را پوشش خواهیم داد. اولین سناریو توضیح خواهد داد که چگونه یک کلمه یا عبارت دقیق را در یک PDF پیدا کرده و آن را جایگزین کنیم. سناریوی دوم به استفاده از عبارات منظم برای مطابقت و جایگزینی الگوهای متغیر مانند شماره تلفن‌ها، شماره حساب‌ها یا سایر فرمت‌های داده سفارشی خواهد پرداخت.

چرا متن را در فایل‌های PDF پیدا و جایگزین کنیم

  • اطمینان از حریم خصوصی و رعایت قوانین: به راحتی داده‌های شخصی یا محرمانه را قبل از انتشار یا به اشتراک‌گذاری فایل‌های PDF حذف کنید.

  • اسناد را به طور مؤثر به‌روزرسانی کنید: به‌طور خودکار اصطلاحات یا محتواهای قدیمی را در میان تعداد زیادی از فایل‌ها جایگزین کنید.

  • گزینه‌های جستجوی متن انعطاف‌پذیر: از تطابق دقیق عبارات و عبارات منظم برای پاک‌سازی جامع استفاده کنید.

  • حفظ یکپارچگی سند: طراحی و فرمت اصلی را حفظ کنید در حالی که محتوا را جایگزین می‌کنید.

متن را در PDF با استفاده از C# پیدا و جایگزین کنید - نصب SDK

شما باید Conholdate.Total for .NET را برای پیدا کردن و جایگزینی متن در مدارک PDF پیکربندی کنید. فایل DLL را از بخش نسخه‌های جدید دانلود کنید یا از دستور نصب NuGet زیر در MS Visual Studio استفاده کنید:

Install-Package Conholdate.Total

یافتن و جایگزینی کلمه در PDF با استفاده از C#

هنگام کار با اسناد PDF که شامل اطلاعات حساس مانند نام‌ها، جزئیات تماس یا شناسه‌های سازمانی هستند، غالباً نیاز به پاک‌سازی یا جایگزینی این کلمات قبل از به اشتراک‌گذاری فایل وجود دارد. Conholdate.Total for .NET SDK راهی ساده برای انجام این کار فراهم می‌کند. مثال زیر نشان می‌دهد که چگونه می‌توان به دنبال یک تطابق دقیق از یک کلمه یا عبارت گشت و آن را با یک جایگزین یا متن جایگزین کرد.

// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

در این قطعه کد، SDK فایل PDF را برای عبارت "John Doe" اسکن کرده و هر مورد را با واژه "[censored]" جایگزین می‌کند. این عملیات به‌ویژه در اتوماسیون حذف اطلاعات شناسایی شخصی از اسناد مفید است. گزینه AddSuffix اطمینان می‌دهد که فایل اصلی بدون تغییر باقی بماند و نسخه ویرایش‌شده به‌عنوان یک فایل جدید ذخیره شود، در حالی که پرچم RasterizeToPDF خروجی را به‌صورت یک PDF مبتنی بر متن نگه‌می‌دارد و آن را به تصویر تبدیل نمی‌کند.

متن را در PDF با عبارات منظم در C# پیدا و جایگزین کنید

گاهی اوقات، متنی که نیاز به جایگزینی در یک PDF دارد، قالب ثابتی ندارد. به عنوان مثال، الگوهایی مانند شماره‌های فاکتور، کدهای پستی یا شماره‌های شناسایی ممکن است از یک سند به سند دیگر متفاوت باشد. در چنین مواردی، عبارات باقاعده (regular expressions) یک راه حل پویا ارائه می‌دهند. SDK Conholdate.Total برای .NET به توسعه‌دهندگان اجازه می‌دهد تا الگوهای regex را برای شناسایی و جایگزینی ساختارهای متنی پیچیده در یک PDF تعریف کنند.

// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

عبارت منظم استفاده شده در این کد الگوی رایجی را برای کدهای فرمت شده، مانند مرجع‌های بانکی یا شناسه‌های تراکنش مطابقت می‌دهد. هر متنی که با این الگو همخوانی داشته باشد به طور خودکار شناسایی و با برچسب از پیش تعیین شده‌ای مانند “[censored]” جایگزین می‌شود. این سطح از انعطاف‌پذیری اطمینان می‌دهد که می‌توانید اطلاعات حساس را حتی زمانی که نمی‌دانید محتوای دقیق آن چه بوده، محافظت کنید.

نتیجه‌گیری

یافتن و جایگزینی متن در اسناد PDF با استفاده از C# هرگز آسان‌تر نبوده است، به لطف قابلیت‌های ارائه شده توسط Conholdate.Total برای .NET. چه در حال جایگزینی یک کلمه خاص باشید و چه در حال جستجوی الگوهای متغیر با عبارات منظم، این SDK اطمینان می‌دهد که می‌توانید محتوای PDF خود را با دقت و کنترل دستکاری کنید. توانایی سانسور اطلاعات حساس، خودکار کردن به‌روزرسانی‌ها و حفظ قالب‌بندی سند این ابزار را برای توسعه‌دهندگان در صنایع مختلف به ابزاری قدرتمند تبدیل می‌کند. آن را امروز در پروژه‌های C# خود ادغام کنید و جریان‌های کاری پردازش سند خود را با اطمینان ساده کنید.

See Also