تعديل محتوى PDF برمجياً يمكن أن يكون ضرورياً في السيناريوهات التي يجب فيها استبدال معلومات حساسة أو قديمة قبل التوزيع. واحدة من الميزات الأكثر عملية في معالجة PDF هي القدرة على البحث عن عبارة أو نمط معين واستبداله بمحتوى بديل. في هذا الدليل المفصل، سنوضح لك كيفية العثور على النص واستبداله في ملفات PDF باستخدام C#. سيكون التركيز على استخدام Conholdate.Total القوي لـ .NET SDK، الذي يمكّن المطورين من أداء مهام معالجة الوثائق القوية بما في ذلك الحذف والاستبدال مع سطرين من التعليمات البرمجية فقط.
سنغطي سيناريوهين مهمين. الأول سيشرح كيفية تحديد كلمة أو عبارة معينة في ملف PDF واستبدالها. الثاني سيتناول استخدام التعبيرات العادية لمطابقة واستبدال الأنماط المتغيرة مثل أرقام الهواتف، أرقام الحسابات، أو صيغ بيانات مخصصة أخرى.
لماذا تجد وتستبدل النص في ملفات PDF
ضمان الخصوصية والامتثال: أزل بسهولة البيانات الشخصية أو السرية قبل نشر أو مشاركة ملفات PDF.
تحديث الوثائق بكفاءة: استبدل المصطلحات أو المحتوى القديم تلقائيًا عبر مجموعات كبيرة من الملفات.
خيارات البحث النصي المرنة: استخدم كل من مطابقة العبارات الدقيقة والتعابير النمطية من أجل الحذف الشامل.
Preserve Document Integrity: Maintain the original layout and formatting while replacing the content.
ابحث واستبدل النص في PDF باستخدام C# - تثبيت SDK
يجب عليك تكوين Conholdate.Total for .NET للعثور على النص واستبداله في مستندات PDF. قم بتنزيل ملف DLL من قسم الإصدارات الجديدة أو استخدم أمر تثبيت NuGet أدناه في MS Visual Studio:
Install-Package Conholdate.Total
البحث واستبدال الكلمات في PDF باستخدام C#
عند التعامل مع مستندات PDF التي تحتوي على معلومات حساسة مثل الأسماء أو تفاصيل الاتصال أو معرّفات المنظمات، غالبًا ما تكون هناك حاجة إلى إخفاء أو استبدال هذه الكلمات قبل مشاركة الملف. يوفر Conholdate.Total لـ .NET SDK طريقة بسيطة لتحقيق ذلك. المثال التالي يوضح كيفية البحث عن تطابق دقيق لكلمة أو عبارة واستبدالها بنص بديل أو نص مؤقت.
// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
في هذه المقتطف، يقوم SDK بمسح ملف PDF بحثًا عن العبارة “جون دو” ويستبدل كل حالة بالعبارة “[censored]”. هذه العملية مفيدة بشكل خاص في أتمتة إزالة المعلومات الشخصية القابلة للتحديد من المستندات. تضمن خيار AddSuffix بقاء الملف الأصلي دون تغيير من خلال حفظ النسخة المعدلة كملف جديد، بينما يحافظ علامة RasterizeToPDF على الإخراج كملف PDF قائم على النص بدلاً من تحويله إلى صورة.
ابحث واستبدل النص في PDF باستخدام التعبيرات العادية في C#
أحيانًا، النص الذي يحتاج إلى استبداله في ملف PDF لا يتبع تنسيقًا ثابتًا. على سبيل المثال، قد تختلف الأنماط مثل أرقام الفواتير، أو الرموز البريدية، أو أرقام التعريف من مستند إلى آخر. في مثل هذه الحالات، تقدم التعبيرات العادية حلاً ديناميكيًا. يسمح Conholdate.Total لـ .NET SDK للمطورين بتعريف أنماط regex للكشف عن استبدال الهياكل النصية المعقدة داخل ملف PDF.
// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
تعبر التعبيرات العادية المستخدمة في هذا الرمز عن نمط شائع الاستخدام بالنسبة للرموز المنسقة، مثل مراجع البنوك أو معرّفات المعاملات. أي نص يتناسب مع هذا النمط يتم تحديده تلقائيًا واستبداله بتسمية محددة مسبقًا مثل “[censored]”. يضمن هذا المستوى من المرونة أنه يمكنك حماية المعلومات الحساسة حتى عندما لا تعرف محتواها الدقيق مسبقًا.
استنتاج
لم يكن البحث واستبدال النص في مستندات PDF باستخدام C# أسهل من أي وقت مضى، وذلك بفضل القدرات التي تقدمها Conholdate.Total لـ .NET. سواء كنت تستبدل كلمة معينة أو تبحث عن أنماط متغيرة باستخدام التعبيرات العادية، يضمن لك هذا SDK أن تتمكن من التلاعب بمحتوى PDF الخاص بك بدقة وتحكم. تجعل القدرة على حذف المعلومات الحساسة، وأتمتة التحديثات، والحفاظ على تنسيق المستندات من هذه الأداة أداة قوية للمطورين عبر الصناعات. قم بدمجها في مشاريع C# الخاصة بك اليوم وسرّع سير عمل معالجة المستندات الخاصة بك بثقة.