تغییر محتویات PDF به طور برنامه‌نویسی می‌تواند در سناریوهایی که اطلاعات حساس یا قدیمی باید قبل از توزیع جایگزین شوند، ضروری باشد. یکی از عملیاتی‌ترین ویژگی‌ها در دستکاری PDF، قابلیت جستجو برای یک عبارت یا الگوی خاص و جایگزینی آن با محتوای جایگزین است. در این راهنمای جامع، ما نشان خواهیم داد که چگونه می‌توانید متن را در فایل‌های PDF با استفاده از Java پیدا و جایگزین کنید. تمرکز بر استفاده از SDK قدرتمند Conholdate.Total برای Java خواهد بود که به توسعه‌دهندگان امکان انجام وظایف قوی دستکاری اسناد از جمله محو کردن و جایگزینی با تنها چند خط کد را می‌دهد.

ما دو سناریو مهم را بررسی خواهیم کرد. سناریوی اول نحوه پیدا کردن یک کلمه یا عبارت دقیق در یک PDF و جایگزینی آن را توضیح می‌دهد. سناریوی دوم به بررسی استفاده از عبارات منظم برای مطابقت و جایگزینی الگوهای متغیر مانند شماره‌های تلفن، شماره‌های حساب یا سایر فرمت‌های داده سفارشی می‌پردازد.

چرا متن را در فایل‌های PDF جستجو و جایگزین کنیم؟

  • اطمینان از حریم خصوصی و رعایت قوانین: به راحتی داده‌های شخصی یا محرمانه را پیش از انتشار یا به اشتراک گذاری فایل‌های PDF حذف کنید.

  • اسناد را به صورت کارآمد به‌روزرسانی کنید: به‌طور خودکار اصطلاحات یا محتوای قدیمی را در بین مجموعه‌های بزرگ فایل‌ها جایگزین کنید.

  • گزینه‌های جستجوی متن انعطاف‌پذیر: از تطابق دقیق عبارات و عبارات منظم برای حذف کامل استفاده کنید.

  • حفظ یکپارچگی سند: layout و فرمت اصلی را حفظ کنید در حالی که محتوا را جایگزین می کنید.

  • دوستدار اتوماسیون: ادغام در جریان‌های کار Java برای پردازش دسته‌ای و وظایف اتوماسیون مدارک.

متن را در PDF با استفاده از Java پیدا و جایگزین کنید - نصب SDK

برای ویرایش اسناد PDF، شما باید SDK Conholdate.Total for Java را در محیط خود پیکربندی کنید. شما می‌توانید فایل DLL را از بخش نسخه‌های جدید دانلود کنید یا از فرمان نصب NuGet زیر در Visual Studio استفاده کنید:

Install-Package Conholdate.Total

متن را در PDF با استفاده از Java پیدا و جایگزین کنید

وقتی با مدارک PDF که حاوی اطلاعات حساس مانند نام‌ها، جزئیات تماس، یا شناسه‌های سازمانی هستند، سر و کار داریم، معمولاً نیاز به سانسور یا جایگزینی این کلمات قبل از به اشتراک گذاری فایل وجود دارد. Conholdate.Total برای Java SDK راهی ساده برای انجام این کار ارائه می‌دهد. مثال زیر نشان می‌دهد که چگونه می‌توان یک تطابق دقیق از یک کلمه یا عبارت جستجو کرده و آن را با یک متن جایگزین یا متن معادل جایگزین کرد.

final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);

در این قطعه کد، SDK فایل PDF را برای عبارت “جان دو” اسکن کرده و هر نمونه را با عبارت “[سانسور]” جایگزین می‌کند. این عمل به ویژه در اتوماسیون حذف اطلاعات شناسایی شخصی از مستندات مفید است. گزینه AddSuffix اطمینان حاصل می‌کند که فایل اصلی بدون تغییر باقی بماند و نسخه ویرایش‌شده به عنوان یک فایل جدید ذخیره شود، در حالی که پرچم RasterizeToPDF خروجی را به صورت یک PDF مبتنی بر متن نگه می‌دارد و به تصویر تبدیل نمی‌کند.

متن را در PDF با عبارات منظم در Java پیدا و جایگزین کنید

گاهی اوقات، متنی که باید در یک PDF جایگزین شود، فرمت ثابتی ندارد. به عنوان مثال، الگوهایی مانند شماره‌های فاکتور، کدهای پستی یا شماره‌های شناسایی ممکن است از یک سند به سند دیگر متفاوت باشند. در چنین شرایطی، عبارت‌های منظم یک راه حل پویا ارائه می‌دهند. Conholdate.Total برای Java SDK به توسعه‌دهندگان اجازه می‌دهد تا الگوهای regex را برای شناسایی و جایگزینی ساختارهای متنی پیچیده در یک PDF تعریف کنند.

// Find text using regular expression and replace it with some other text using Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();

عبارت منظم استفاده شده در این کد یک الگوی معمولاً برای کدهای فرمت شده، مانند مراجع بانکی یا شناسایی تراکنش‌ها را مطابقت می‌دهد. هر متنی که با این الگو مطابقت داشته باشد به‌طور خودکار شناسایی و با یک برچسب از پیش تعیین شده مانند “[censored]” جایگزین می‌شود. این سطح از انعطاف‌پذیری تضمین می‌کند که می‌توانید اطلاعات حساس را حتی زمانی که از محتوای دقیق آن اطلاع ندارید، محافظت کنید.

نتیجه گیری

یافتن و جایگزینی متن در اسناد PDF با استفاده از Java هرگز به این آسانی نبوده است، به لطف قابلیت‌های ارائه شده توسط Conholdate.Total برای جاوا. چه شما در حال جایگزینی یک کلمه خاص باشید و چه در حال جستجوی الگوهای متغیر با استفاده از عبارات منظم، این SDK اطمینان می‌دهد که می‌توانید محتوای PDF خود را با دقت و کنترل دستکاری کنید. قابلیت حذف اطلاعات حساس، خودکارسازی به‌روزرسانی‌ها و حفظ فرمت سند، این ابزار را به ابزاری قدرتمند برای توسعه‌دهندگان در صنایع مختلف تبدیل می‌کند. امروز آن را به پروژه‌های جاوای خود ادغام کنید و جریان‌ کاری پردازش اسناد خود را با اطمینان بهینه کنید.

ببینید همچنین