การปรับเปลี่ยนเนื้อหา PDF อย่างมีระเบียบทางโปรแกรมอาจเป็นสิ่งจำเป็นในกรณีที่ข้อมูลที่ละเอียดอ่อนหรือข้อมูลที่ล้าสมัยต้องถูกแทนที่ก่อนการแจกจ่าย หนึ่งในฟีเจอร์ที่มีประโยชน์มากที่สุดในการจัดการ PDF คือความสามารถในการค้นหาวลีหรือรูปแบบเฉพาะและแทนที่ด้วยเนื้อหาทางเลือก ในคู่มือที่ละเอียดนี้ เราจะแสดงวิธีการค้นหาและแทนที่ข้อความในไฟล์ PDF โดยใช้ Java จุดสนใจจะอยู่ที่การใช้ Conholdate.Total for Java SDK ที่ทรงพลังซึ่งช่วยให้นักพัฒนาสามารถทำงานที่เกี่ยวข้องกับการปรับเปลี่ยนเอกสารอย่างมีประสิทธิภาพ รวมถึงการลบและการแทนที่ด้วยรหัสไม่กี่บรรทัด
เราจะครอบคลุมสถานการณ์ที่สำคัญสองประการ ประการแรกจะอธิบายวิธีการค้นหาคำหรือวลีที่แน่นอนใน PDF และแทนที่มัน ประการที่สองจะนำเสนอวิธีการใช้รูปแบบธรรมดาเพื่อจับคู่และแทนที่รูปแบบที่เปลี่ยนแปลงได้ เช่น หมายเลขโทรศัพท์ หมายเลขบัญชี หรือรูปแบบข้อมูลที่กำหนดเองอื่นๆ
ทำไมถึงต้องค้นหาและแทนที่ข้อความในไฟล์ PDF?
ตรวจสอบความเป็นส่วนตัวและการปฏิบัติตาม: ลบข้อมูลส่วนบุคคลหรือข้อมูลที่เป็นความลับได้อย่างง่ายดายก่อนที่จะเผยแพร่หรือแบ่งปันไฟล์ PDF
อัปเดตเอกสารอย่างมีประสิทธิภาพ: เปลี่ยนคำหรือเนื้อหาที่ล้าสมัยโดยอัตโนมัติในชุดไฟล์ขนาดใหญ่
ตัวเลือกการค้นหาข้อความที่ยืดหยุ่น: ใช้การจับคู่วลีที่แน่นอนและการแสดงออกตามปกติสำหรับการลบข้อมูลอย่างละเอียดหมดจด。
Preserve Document Integrity: Maintain the original layout and formatting while replacing the content.
Automation Friendly: Integrate into Java workflows for batch processing and document automation tasks.
ค้นหาและแทนที่ข้อความใน PDF โดยใช้ Java - การติดตั้ง SDK
ในการแก้ไขเอกสาร PDF คุณต้องตั้งค่า Conholdate.Total for Java SDK ในสภาพแวดล้อมของคุณ คุณสามารถดาวน์โหลดไฟล์ DLL ได้จากส่วน New Releases หรือใช้คำสั่งติดตั้ง NuGet ด้านล่างใน Visual Studio:
Install-Package Conholdate.Total
ค้นหาและแทนที่ข้อความใน PDF โดยใช้ Java
เมื่อจัดการกับเอกสาร PDF ที่มีข้อมูลที่ละเอียดอ่อน เช่น ชื่อ รายละเอียดการติดต่อ หรือรหัสประจำองค์กร มักจะมีความจำเป็นในการลบหรือแทนที่คำเหล่านี้ก่อนที่จะมีการแชร์ไฟล์ Conholdate.Total สำหรับ Java SDK นำเสนอวิธีที่ตรงไปตรงมาสำหรับการทำเช่นนี้ ตัวอย่างต่อไปนี้แสดงให้เห็นวิธีการค้นหาคำหรือวลีที่ตรงตามแบบและแทนที่ด้วยตัวแทนหรือข้อความทางเลือก
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);
ในส่วนนี้ SDK จะสแกนไฟล์ PDF เพื่อค้นหาวลี "John Doe" และแทนที่ทุกกรณีด้วยคำว่า "[censored]" การดำเนินการนี้มีประโยชน์โดยเฉพาะในการทำให้การลบข้อมูลที่สามารถระบุบุคคลได้จากเอกสารเป็นไปโดยอัตโนมัติ ตัวเลือก AddSuffix จะทำให้ไฟล์ต้นฉบับไม่ถูกแตะต้องโดยการบันทึกเวอร์ชันที่แก้ไขเป็นไฟล์ใหม่ ในขณะที่ธง RasterizeToPDF จะทำให้ผลลัพธ์อยู่ในรูปแบบ PDF ที่อิงตามข้อความแทนที่จะเปลี่ยนเป็นรูปภาพ
ค้นหาและแทนที่ข้อความใน PDF ด้วยนิพจน์ปกติใน Java
บางครั้ง ข้อความที่ต้องการเปลี่ยนใน PDF จะไม่มีรูปแบบที่แน่นอน ตัวอย่างเช่น รูปแบบเช่นหมายเลขใบแจ้งหนี้ รหัสไปรษณีย์ หรือหมายเลขประจำตัว อาจแตกต่างกันไปในแต่ละเอกสาร ในสถานการณ์เช่นนี้ การใช้ regular expressions จะเสนอวิธีแก้ปัญหาที่พลิกแพลง Conholdate.Total สำหรับ Java SDK อนุญาตให้นักพัฒนากำหนดรูปแบบ regex เพื่อค้นหาและแทนที่โครงสร้างข้อความที่ซับซ้อนภายใน PDF
// Find text using regular expression and replace it with some other text using Java
final Redactor redactor = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();
นิพจน์ปกติที่ใช้ในโค้ดนี้จะตรงกับรูปแบบที่ใช้กันทั่วไปสำหรับรหัสที่จัดรูปแบบ เช่น การอ้างอิงธนาคารหรือหมายเลขระบุการทำธุรกรรม ข้อความใด ๆ ที่ตรงตามรูปแบบนี้จะถูกค้นหาและแทนที่โดยอัตโนมัติด้วยป้ายกำกับที่กำหนดไว้ล่วงหน้าเช่น “[censored]” ระดับความยืดหยุ่นนี้ทำให้คุณสามารถปกป้องข้อมูลที่ละเอียดอ่อนแม้ว่า คุณจะไม่ทราบเนื้อหาที่แน่นอนล่วงหน้า
บทสรุป
การค้นหาและแทนที่ข้อความในเอกสาร PDF โดยใช้ Java นั้นไม่เคยง่ายเท่านี้มาก่อน ขอบคุณฟีเจอร์ที่เสนอโดย Conholdate.Total สำหรับ Java ไม่ว่าคุณจะเปลี่ยนคำเฉพาะหรือค้นหารูปแบบที่แตกต่างกันด้วยการแสดงออกแบบปกติ SDK นี้ช่วยให้คุณสามารถจัดการเนื้อหา PDF ของคุณได้อย่างแม่นยำและควบคุม การสามารถลบข้อมูลที่ละเอียดอ่อน รวมถึงการทำอัตโนมัติในการอัปเดตและการรักษาฟอร์แมตเอกสาร ทำให้เครื่องมือนี้เป็นเครื่องมือที่ทรงพลังสำหรับนักพัฒนาทั่วทุกอุตสาหกรรม รวมเข้ากับโปรเจกต์ Java ของคุณในวันนี้และทำให้การดำเนินการเอกสารของคุณเป็นไปอย่างราบรื่นด้วยความมั่นใจ