تغییر محتویات PDF به طور برنامهنویسی میتواند در سناریوهایی که اطلاعات حساس یا قدیمی باید قبل از توزیع جایگزین شوند، ضروری باشد. یکی از عملیاتیترین ویژگیها در دستکاری PDF، قابلیت جستجو برای یک عبارت یا الگوی خاص و جایگزینی آن با محتوای جایگزین است. در این راهنمای جامع، ما نشان خواهیم داد که چگونه میتوانید متن را در فایلهای PDF با استفاده از Java پیدا و جایگزین کنید. تمرکز بر استفاده از SDK قدرتمند Conholdate.Total برای Java خواهد بود که به توسعهدهندگان امکان انجام وظایف قوی دستکاری اسناد از جمله محو کردن و جایگزینی با تنها چند خط کد را میدهد.
ما دو سناریو مهم را بررسی خواهیم کرد. سناریوی اول نحوه پیدا کردن یک کلمه یا عبارت دقیق در یک PDF و جایگزینی آن را توضیح میدهد. سناریوی دوم به بررسی استفاده از عبارات منظم برای مطابقت و جایگزینی الگوهای متغیر مانند شمارههای تلفن، شمارههای حساب یا سایر فرمتهای داده سفارشی میپردازد.
چرا متن را در فایلهای PDF جستجو و جایگزین کنیم؟
اطمینان از حریم خصوصی و رعایت قوانین: به راحتی دادههای شخصی یا محرمانه را پیش از انتشار یا به اشتراک گذاری فایلهای PDF حذف کنید.
اسناد را به صورت کارآمد بهروزرسانی کنید: بهطور خودکار اصطلاحات یا محتوای قدیمی را در بین مجموعههای بزرگ فایلها جایگزین کنید.
گزینههای جستجوی متن انعطافپذیر: از تطابق دقیق عبارات و عبارات منظم برای حذف کامل استفاده کنید.
حفظ یکپارچگی سند: layout و فرمت اصلی را حفظ کنید در حالی که محتوا را جایگزین می کنید.
دوستدار اتوماسیون: ادغام در جریانهای کار Java برای پردازش دستهای و وظایف اتوماسیون مدارک.
متن را در PDF با استفاده از Java پیدا و جایگزین کنید - نصب SDK
برای ویرایش اسناد PDF، شما باید SDK Conholdate.Total for Java را در محیط خود پیکربندی کنید. شما میتوانید فایل DLL را از بخش نسخههای جدید دانلود کنید یا از فرمان نصب NuGet زیر در Visual Studio استفاده کنید:
Install-Package Conholdate.Total
متن را در PDF با استفاده از Java پیدا و جایگزین کنید
وقتی با مدارک PDF که حاوی اطلاعات حساس مانند نامها، جزئیات تماس، یا شناسههای سازمانی هستند، سر و کار داریم، معمولاً نیاز به سانسور یا جایگزینی این کلمات قبل از به اشتراک گذاری فایل وجود دارد. Conholdate.Total برای Java SDK راهی ساده برای انجام این کار ارائه میدهد. مثال زیر نشان میدهد که چگونه میتوان یک تطابق دقیق از یک کلمه یا عبارت جستجو کرده و آن را با یک متن جایگزین یا متن معادل جایگزین کرد.
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);
در این قطعه کد، SDK فایل PDF را برای عبارت “جان دو” اسکن کرده و هر نمونه را با عبارت “[سانسور]” جایگزین میکند. این عمل به ویژه در اتوماسیون حذف اطلاعات شناسایی شخصی از مستندات مفید است. گزینه AddSuffix اطمینان حاصل میکند که فایل اصلی بدون تغییر باقی بماند و نسخه ویرایششده به عنوان یک فایل جدید ذخیره شود، در حالی که پرچم RasterizeToPDF خروجی را به صورت یک PDF مبتنی بر متن نگه میدارد و به تصویر تبدیل نمیکند.
متن را در PDF با عبارات منظم در Java پیدا و جایگزین کنید
گاهی اوقات، متنی که باید در یک PDF جایگزین شود، فرمت ثابتی ندارد. به عنوان مثال، الگوهایی مانند شمارههای فاکتور، کدهای پستی یا شمارههای شناسایی ممکن است از یک سند به سند دیگر متفاوت باشند. در چنین شرایطی، عبارتهای منظم یک راه حل پویا ارائه میدهند. Conholdate.Total برای Java SDK به توسعهدهندگان اجازه میدهد تا الگوهای regex را برای شناسایی و جایگزینی ساختارهای متنی پیچیده در یک PDF تعریف کنند.
// Find text using regular expression and replace it with some other text using Java
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();
عبارت منظم استفاده شده در این کد یک الگوی معمولاً برای کدهای فرمت شده، مانند مراجع بانکی یا شناسایی تراکنشها را مطابقت میدهد. هر متنی که با این الگو مطابقت داشته باشد بهطور خودکار شناسایی و با یک برچسب از پیش تعیین شده مانند “[censored]” جایگزین میشود. این سطح از انعطافپذیری تضمین میکند که میتوانید اطلاعات حساس را حتی زمانی که از محتوای دقیق آن اطلاع ندارید، محافظت کنید.
نتیجه گیری
یافتن و جایگزینی متن در اسناد PDF با استفاده از Java هرگز به این آسانی نبوده است، به لطف قابلیتهای ارائه شده توسط Conholdate.Total برای جاوا. چه شما در حال جایگزینی یک کلمه خاص باشید و چه در حال جستجوی الگوهای متغیر با استفاده از عبارات منظم، این SDK اطمینان میدهد که میتوانید محتوای PDF خود را با دقت و کنترل دستکاری کنید. قابلیت حذف اطلاعات حساس، خودکارسازی بهروزرسانیها و حفظ فرمت سند، این ابزار را به ابزاری قدرتمند برای توسعهدهندگان در صنایع مختلف تبدیل میکند. امروز آن را به پروژههای جاوای خود ادغام کنید و جریان کاری پردازش اسناد خود را با اطمینان بهینه کنید.