جستجو و جایگزینی در ورد

در پست وبلاگ امروز، ما به بررسی چگونگی پیدا کردن و جایگزینی متن در اسناد Word (DOC/DOCX) با استفاده از Java خواهیم پرداخت. ما جنبه‌های مختلف این کار را شامل کار با API پاک‌سازی متن Word جاوا، پیدا کردن و جایگزینی کلمات یا عبارات، جستجوهای حساس به حروف بزرگ و حتی جایگزینی متن با استفاده از عبارات منظم (RegEx) برای جایگزینی‌های پیشرفته پوشش خواهیم داد.

نقاط زیر در این مقاله پوشش داده خواهد شد:

کتابخانه ویرایش متن Java - نصب

برای شروع، ما باید کتابخانه Conholdate.Total for Java را راه‌اندازی کنیم. روند نصب این کتابخانه Java بسیار ساده است. کاربران Maven به سادگی می‌توانند تنظیمات زیر را در فایل pom.xml اضافه کنند.

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

سپس دستورات زیر را اجرا کنید.

mvn clean    
mvn install -U

برای پیکربندی سایر فریم‌ورک‌های جاوا، لطفاً به releases.conholdate.com مراجعه کنید.

مجوز رایگان بگیرید

شما می‌توانید یک مجوز موقت رایگان را برای آزمایش کتابخانه بدون محدودیت‌های ارزیابی دانلود کنید.

سوالی بپرسید

شما می‌توانید سوالات یا نظرات خود را در مورد کتابخانه حذف صفحه PDF Java در این forum ارسال کنید.

استفاده از کتابخانه ویرایش متن ورد جاوا

وداع بگویید با زحمت وابسته بودن به MS Word برای ویرایش متن. با جاوا، می‌توانیم همه چیز را خودمان مدیریت کنیم، نیازی به نرم‌افزار خارجی نیست. ما به بررسی رویکردهای مختلف برای یافتن و جایگزینی متن در مستندات ورد با استفاده از Java خواهیم پرداخت. ما از قدرت Java برای انجام عملیات جستجو و جایگزینی کارآمد بهره خواهیم برد. شما شگفت‌زده خواهید شد که چگونه به‌راحتی می‌توانید تغییرات متنی را به‌صورت برنامه‌نویسی با استفاده از این زبان برنامه‌نویسی چندمنظوره مدیریت کنید.

ما از سند Word نمونه استفاده خواهیم کرد که در عکس زیر نشان داده شده است:

یک صفحه از پی‌دی‌اف را حذف کنید

جستجو و جایگزینی کلمات یا عبارات: مراحل نوشتن برنامه Java

پیروی از مراحل زیر توضیح می‌دهد که چگونه هر مورد از یک کلمه/عبارت را در یک سند Word پیدا کرده و سپس جایگزین کنیم.

  1. ابتدا فایل DOC/DOCX را با استفاده از کلاس Redactor بارگذاری کنید.
  2. سپس، عبارت یا کلمه هدف را با استفاده از ExactPhraseRedaction و ReplacementOptions کلاس‌ها پیدا کنید.
  3. Next, apply the redaction using the apply method of Redactor.
  4. پس از آن، فایل اصلاح شده را با استفاده از جریان خروجی در مکان دیگری ذخیره کنید.
  5. Finally, save the redaction changes using the save method.

کد Java زیر کلمه “John Doe” را در سند ورد بالا پیدا کرده و تمام موارد “John Doe” را با کلمه “[censored]” جایگزین می‌کند.

// عبارت دقیق را پیدا کرده و آن را با متن دیگری با استفاده از Java جایگزین کنید.
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);

خروجی کد به صورت زیر است.

جستجو و جایگزینی کلمه

متن حساس به حالت را پیدا و جایگزین کنید

حالت دقیق حروف کلمه به نظر برای شما مهم است و شما فقط می‌خواهید آن را با کلماتی که به جستجوی حساس به بزرگ و کوچک حروف شما مربوط می‌شوند، جایگزین کنید. کد زیر مواردی از تطابق دقیق حالت کلمه “John Doe” را در Java جایگزین می‌کند.

// عبارت دقیق را (حساس به حروف بزرگ و کوچک) پیدا کرده و با متن دیگری با استفاده از Java جایگزین کنید
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", true /*isCaseSensitive*/, new ReplacementOptions("[censored]")));
redactor.save();

خروجی کد به صورت زیر است.

یافتن و جایگزینی متن حساس به بزرگ و کوچک بودن حروف

یافتن و جایگزینی با استفاده از عبارات منظم (RegEx) در Java

اگر می‌خواهید یک الگو را در داخل سند خود به‌روزرسانی کنید نه یک کلمه خاص. می‌توانید از عبارات منظم (RegEx) در برنامه‌های Java برای پیدا کردن و جایگزینی هر الگوی متنی با دنبال کردن مراحل زیر استفاده کنید.

  1. Load the document with the Redactor class.
  2. یک الگوی RegEx با استفاده از RegexRedaction ایجاد کنید.
  3. متن جایگزین را با ReplacementOptions مشخص کنید.
  4. اعمال کنید redaction با استفاده از apply روش.
  5. مدرک مبتنی بر سانسور را با استفاده از save روش ذخیره کنید.

کد Java زیر نشان می‌دهد که چگونه جستجوی کلمات را در یک سند MS Word با استفاده از RegEx انجام دهیم و آن را با متن دیگری جایگزین کنیم.

// متن را با استفاده از عبارات منظم پیدا کنید و آن را با متن دیگری با استفاده از Java جایگزین کنید
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();

خروجی کد به صورت زیر است.

regex find and replace

نتیجه گیری

تا پایان این پست وبلاگ، شما درک جامعی از نحوه یافتن و جایگزینی متن در اسناد Word با استفاده از Java و کتابخانه Conholdate.Total برای Java خواهید داشت. شما با دانش و ابزارهای لازم برای خودکارسازی این وظیفه به طور مؤثر، محصولیت را بهبود بخشیده و جریان‌های کار دستکاری اسناد را ساده‌تر خواهید کرد. پس بیایید شروع کنیم و از قدرت Conholdate.Total برای Java برای بهبود پردازش اسناد Word مبتنی بر Java خود بهره‌برداری کنیم!

سرانجام، لطفاً به بازدید از conholdate.com برای بروزرسانی‌های منظم ادامه دهید.

همچنین ببینید