Modifikasi konten PDF secara programatis dapat menjadi penting dalam skenario di mana informasi sensitif atau usang harus diganti sebelum distribusi. Salah satu fitur paling praktis dalam manipulasi PDF adalah kemampuan untuk mencari frasa atau pola tertentu dan menggantinya dengan konten alternatif. Dalam panduan mendetail ini, kami akan menunjukkan bagaimana Anda dapat menemukan dan mengganti teks dalam file PDF menggunakan C#. Fokus akan diberikan pada penggunaan Conholdate.Total yang kuat untuk .NET SDK, yang memungkinkan pengembang untuk melakukan tugas manipulasi dokumen yang kuat termasuk redaksi dan penggantian dengan hanya beberapa baris kode.
Kami akan membahas dua skenario penting. Yang pertama akan menjelaskan cara menemukan kata atau frasa yang tepat dalam PDF dan menggantinya. Yang kedua akan menjelaskan cara menggunakan ekspresi reguler untuk mencocokkan dan mengganti pola variabel seperti nomor telepon, nomor rekening, atau format data kustom lainnya.
Mengapa Mencari dan Mengganti Teks di Berkas PDF
Pastikan Privasi dan Kepatuhan: Dengan mudah hapus data pribadi atau rahasia sebelum menerbitkan atau membagikan file PDF.
Perbarui Dokumen Secara Efisien: Secara otomatis mengganti istilah atau konten yang sudah ketinggalan zaman di seluruh berbagai file.
Opsi Pencarian Teks Fleksibel: Manfaatkan pencocokan frasa tepat dan ekspresi reguler untuk penutupan yang komprehensif.
Preserve Document Integrity: Maintain the original layout and formatting while replacing the content.
Temukan dan Ganti Teks di PDF menggunakan C# - Instalasi SDK
Anda harus mengonfigurasi Conholdate.Total for .NET untuk menemukan dan mengganti teks dalam dokumen PDF. Unduh file DLL dari bagian Rilis Baru atau gunakan perintah instalasi NuGet di bawah ini di MS Visual Studio:
Install-Package Conholdate.Total
Temukan dan Ganti Kata di PDF menggunakan C#
When dealing with PDF documents that contain sensitive information like names, contact details, or organization identifiers, there is often a need to redact or replace these words before sharing the file. Conholdate.Total for .NET SDK provides a straightforward way to accomplish this. The following example demonstrates how to search for an exact match of a word or phrase and substitute it with a placeholder or alternative text.
// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
Dalam cuplikan ini, SDK memindai file PDF untuk frasa "John Doe" dan mengganti setiap instansi dengan istilah "[censored]". Operasi ini sangat berguna untuk mengotomatiskan penghapusan informasi yang dapat diidentifikasi secara pribadi dari dokumen. Opsi AddSuffix memastikan file asli tetap tidak tersentuh dengan menyimpan versi yang diedit sebagai file baru, sementara bendera RasterizeToPDF mempertahankan output sebagai PDF berbasis teks daripada mengubahnya menjadi gambar.
Temukan dan Ganti Teks dalam PDF dengan Ekspresi Reguler di C#
Terkadang, teks yang perlu diganti dalam PDF tidak mengikuti format yang tetap. Misalnya, pola seperti nomor faktur, kode pos, atau nomor identifikasi dapat bervariasi dari dokumen ke dokumen. Dalam situasi seperti itu, ekspresi reguler menawarkan solusi dinamis. Conholdate.Total untuk .NET SDK memungkinkan pengembang untuk mendefinisikan pola regex untuk mendeteksi dan mengganti struktur teks yang kompleks dalam PDF.
// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
Ekspresi reguler yang digunakan dalam kode ini mencocokkan pola yang umum digunakan untuk kode yang diformat, seperti referensi bank atau pengenal transaksi. Teks apa pun yang sesuai dengan pola ini secara otomatis ditemukan dan diganti dengan label yang telah ditentukan seperti "[censored]". Tingkat fleksibilitas ini memastikan Anda dapat melindungi informasi sensitif bahkan ketika Anda tidak tahu kontennya yang tepat sebelumnya.
Kesimpulan
Mencari dan mengganti teks dalam dokumen PDF menggunakan C# tidak pernah semudah ini, berkat kemampuan yang ditawarkan oleh Conholdate.Total untuk .NET. Apakah Anda mengganti kata tertentu atau mencari pola variabel dengan ekspresi reguler, SDK ini memastikan bahwa Anda dapat memanipulasi konten PDF Anda dengan presisi dan kontrol. Kemampuan untuk menyunting informasi sensitif, mengotomatiskan pembaruan, dan mempertahankan format dokumen menjadikannya alat yang kuat bagi pengembang di berbagai industri. Integrasikan ke dalam proyek C# Anda hari ini dan permudah alur proses dokumen Anda dengan percaya diri.