Программное изменение содержимого PDF может быть необходимо в сценариях, когда необходимо заменить конфиденциальную или устаревшую информацию перед распространением. Одна из самых практичных функций в манипуляциях с PDF — это возможность искать конкретную фразу или шаблон и заменять её на альтернативное содержимое. В этом подробном руководстве мы продемонстрируем, как вы можете искать и заменять текст в PDF-файлах, используя C#. Основное внимание будет уделено использованию мощного SDK Conholdate.Total для .NET, который позволяет разработчикам выполнять надежные задачи по манипуляции документами, включая редактирование и замену всего лишь несколькими строками кода.

Мы рассмотрим два важных сценария. Первый объяснит, как найти точное слово или фразу в PDF и заменить их. Второй пройдет через использование регулярных выражений для сопоставления и замены переменных шаблонов, таких как номера телефонов, номера счетов или другие пользовательские форматы данных.

Почему искать и заменять текст в PDF-файлах

  • Обеспечьте конфиденциальность и соответствие: Легко удаляйте личные или конфиденциальные данные перед публикацией или обменом PDF-файлами.

  • Обновите документы эффективно: автоматически заменяйте устаревшие термины или содержимое в больших партиях файлов.

  • Гибкие варианты текстового поиска: используйте как точное сопоставление фраз, так и регулярные выражения для всестороннего редактирования.

  • Сохранить целостность документа: Сохраняйте оригинальное создание и форматирование, заменяя содержимое.

Найдите и замените текст в PDF с использованием C# - Установка SDK

Вам необходимо настроить Conholdate.Total for .NET для поиска и замены текста в PDF-документах. Скачайте файл DLL из раздела Новые релизы или используйте следующую команду установки NuGet в MS Visual Studio:

Install-Package Conholdate.Total

Найдите и замените слово в PDF с использованием C#

Когда дело касается PDF-документов, содержащих конфиденциальную информацию, такую как имена, контактные данные или идентификаторы организаций, часто возникает необходимость зачеркивания или замены этих слов перед передачей файла. Conholdate.Total для .NET SDK предоставляет простой способ достижения этой цели. Следующий пример демонстрирует, как найти точное совпадение слова или фразы и заменить его на заполнитель или альтернативный текст.

// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

В этом фрагменте SDK сканирует PDF-файл на наличие фразы "John Doe" и заменяет каждое вхождение на термин "[censored]". Эта операция особенно полезна для автоматизации удаления личной информации из документов. Опция AddSuffix гарантирует, что оригинальный файл останется нетронутым, сохраняя отредактированную версию как новый файл, в то время как флаг RasterizeToPDF сохраняет выходной файл в текстовом формате PDF вместо преобразования его в изображение.

Найдите и замените текст в PDF с помощью регулярных выражений на C#

Иногда текст, который необходимо заменить в PDF, не соответствует фиксированному формату. Например, такие шаблоны, как номера счетов, почтовые коды или идентификационные номера, могут варьироваться от документа к документу. В таких ситуациях регулярные выражения предлагают динамическое решение. Conholdate.Total для .NET SDK позволяет разработчикам определять regex шаблоны для обнаружения и замены сложных текстовых структур в PDF.

// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

Регулярное выражение, используемое в этом коде, соответствует шаблону, который часто используется для форматированных кодов, таких как банковские ссылки или идентификаторы транзакций. Любой текст, соответствующий этому шаблону, автоматически находится и заменяется на предопределенную метку, такую как “[censored]”. Этот уровень гибкости гарантирует, что вы можете защищать конфиденциальную информацию, даже когда заранее не знаете ее точное содержание.

Заключение

Нахождение и замена текста в PDF-документах с использованием C# никогда не были проще, благодаря возможностям, предлагаемым Conholdate.Total для .NET. Независимо от того, заменяете ли вы конкретное слово или ищете переменные шаблоны с помощью регулярных выражений, этот SDK гарантирует, что вы сможете манипулировать содержимым вашего PDF с точностью и контролем. Способность редактировать конфиденциальную информацию, автоматизировать обновления и сохранять форматирование документа делает этот инструмент мощным для разработчиков в различных отраслях. Интегрируйте его в ваши проекты на C# сегодня и оптимизируйте ваши рабочие потоки обработки документов с уверенностью.

См. Также