
در پست وبلاگ امروز، ما به بررسی چگونگی پیدا کردن و جایگزینی متن در اسناد Word (DOC/DOCX) با استفاده از Java خواهیم پرداخت. ما جنبههای مختلف این کار را شامل کار با API پاکسازی متن Word جاوا، پیدا کردن و جایگزینی کلمات یا عبارات، جستجوهای حساس به حروف بزرگ و حتی جایگزینی متن با استفاده از عبارات منظم (RegEx) برای جایگزینیهای پیشرفته پوشش خواهیم داد.
نقاط زیر در این مقاله پوشش داده خواهد شد:
- کتابخانه Java برای جستجو و جایگزینی در ورد
- جستجو و جایگزینی کلمات یا عبارات
- جستجو و جایگزینی متن حساس به حروف بزرگ و کوچک
- متن را با استفاده از عبارات منظم جایگزین کنید
کتابخانه ویرایش متن Java - نصب
برای شروع، ما باید کتابخانه Conholdate.Total for Java را راهاندازی کنیم. روند نصب این کتابخانه Java بسیار ساده است. کاربران Maven به سادگی میتوانند تنظیمات زیر را در فایل pom.xml اضافه کنند.
<repository>
<id>ConholdateJavaAPI</id>
<name>Conholdate Java API</name>
<url>https://releases.conholdate.com/java/repo</url>
</repository>
<dependency>
<groupId>com.conholdate</groupId>
<artifactId>conholdate-total</artifactId>
<version>23.6</version>
<type>pom</type>
</dependency>
سپس دستورات زیر را اجرا کنید.
mvn clean
mvn install -U
برای پیکربندی سایر فریمورکهای جاوا، لطفاً به releases.conholdate.com مراجعه کنید.
مجوز رایگان بگیرید
شما میتوانید یک مجوز موقت رایگان را برای آزمایش کتابخانه بدون محدودیتهای ارزیابی دانلود کنید.
سوالی بپرسید
شما میتوانید سوالات یا نظرات خود را در مورد کتابخانه حذف صفحه PDF Java در این forum ارسال کنید.
استفاده از کتابخانه ویرایش متن ورد جاوا
وداع بگویید با زحمت وابسته بودن به MS Word برای ویرایش متن. با جاوا، میتوانیم همه چیز را خودمان مدیریت کنیم، نیازی به نرمافزار خارجی نیست. ما به بررسی رویکردهای مختلف برای یافتن و جایگزینی متن در مستندات ورد با استفاده از Java خواهیم پرداخت. ما از قدرت Java برای انجام عملیات جستجو و جایگزینی کارآمد بهره خواهیم برد. شما شگفتزده خواهید شد که چگونه بهراحتی میتوانید تغییرات متنی را بهصورت برنامهنویسی با استفاده از این زبان برنامهنویسی چندمنظوره مدیریت کنید.
ما از سند Word نمونه استفاده خواهیم کرد که در عکس زیر نشان داده شده است:
جستجو و جایگزینی کلمات یا عبارات: مراحل نوشتن برنامه Java
پیروی از مراحل زیر توضیح میدهد که چگونه هر مورد از یک کلمه/عبارت را در یک سند Word پیدا کرده و سپس جایگزین کنیم.
- ابتدا فایل DOC/DOCX را با استفاده از کلاس Redactor بارگذاری کنید.
- سپس، عبارت یا کلمه هدف را با استفاده از ExactPhraseRedaction و ReplacementOptions کلاسها پیدا کنید.
- Next, apply the redaction using the apply method of Redactor.
- پس از آن، فایل اصلاح شده را با استفاده از جریان خروجی در مکان دیگری ذخیره کنید.
- Finally, save the redaction changes using the save method.
کد Java زیر کلمه “John Doe” را در سند ورد بالا پیدا کرده و تمام موارد “John Doe” را با کلمه “[censored]” جایگزین میکند.
// عبارت دقیق را پیدا کرده و آن را با متن دیگری با استفاده از Java جایگزین کنید.
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);
خروجی کد به صورت زیر است.
متن حساس به حالت را پیدا و جایگزین کنید
حالت دقیق حروف کلمه به نظر برای شما مهم است و شما فقط میخواهید آن را با کلماتی که به جستجوی حساس به بزرگ و کوچک حروف شما مربوط میشوند، جایگزین کنید. کد زیر مواردی از تطابق دقیق حالت کلمه “John Doe” را در Java جایگزین میکند.
// عبارت دقیق را (حساس به حروف بزرگ و کوچک) پیدا کرده و با متن دیگری با استفاده از Java جایگزین کنید
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", true /*isCaseSensitive*/, new ReplacementOptions("[censored]")));
redactor.save();
خروجی کد به صورت زیر است.
یافتن و جایگزینی با استفاده از عبارات منظم (RegEx) در Java
اگر میخواهید یک الگو را در داخل سند خود بهروزرسانی کنید نه یک کلمه خاص. میتوانید از عبارات منظم (RegEx) در برنامههای Java برای پیدا کردن و جایگزینی هر الگوی متنی با دنبال کردن مراحل زیر استفاده کنید.
- Load the document with the Redactor class.
- یک الگوی RegEx با استفاده از RegexRedaction ایجاد کنید.
- متن جایگزین را با ReplacementOptions مشخص کنید.
- اعمال کنید redaction با استفاده از apply روش.
- مدرک مبتنی بر سانسور را با استفاده از save روش ذخیره کنید.
کد Java زیر نشان میدهد که چگونه جستجوی کلمات را در یک سند MS Word با استفاده از RegEx انجام دهیم و آن را با متن دیگری جایگزین کنیم.
// متن را با استفاده از عبارات منظم پیدا کنید و آن را با متن دیگری با استفاده از Java جایگزین کنید
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();
خروجی کد به صورت زیر است.
نتیجه گیری
تا پایان این پست وبلاگ، شما درک جامعی از نحوه یافتن و جایگزینی متن در اسناد Word با استفاده از Java و کتابخانه Conholdate.Total برای Java خواهید داشت. شما با دانش و ابزارهای لازم برای خودکارسازی این وظیفه به طور مؤثر، محصولیت را بهبود بخشیده و جریانهای کار دستکاری اسناد را سادهتر خواهید کرد. پس بیایید شروع کنیم و از قدرت Conholdate.Total برای Java برای بهبود پردازش اسناد Word مبتنی بر Java خود بهرهبرداری کنیم!
سرانجام، لطفاً به بازدید از conholdate.com برای بروزرسانیهای منظم ادامه دهید.