PDF 콘텐츠를 프로그래밍적으로 수정하는 것은 민감하거나 구식 정보를 배포 전에 교체해야 하는 시나리오에서 필수적일 수 있습니다. PDF 조작에서 가장 실용적인 기능 중 하나는 특정 구문이나 패턴을 검색하고 이를 대체 콘텐츠로 교체하는 기능입니다. 이 자세한 가이드에서는 C#을 사용하여 PDF 파일에서 텍스트를 찾고 교체하는 방법을 시연할 것입니다. 개발자가 몇 줄의 코드만으로 강력한 문서 조작 작업을 수행할 수 있도록 하는 강력한 Conholdate.Total for .NET SDK를 사용하는 데 중점을 둘 것입니다.
우리는 두 가지 중요한 시나리오를 다룰 것입니다. 첫 번째는 PDF에서 정확한 단어나 구문을 찾고 그것을 대체하는 방법을 설명할 것입니다. 두 번째는 전화번호, 계좌번호 또는 기타 사용자 지정 데이터 형식과 같은 변수를 일치시키고 대체하는 데 정규 표현식을 사용하는 방법을 안내할 것입니다.
PDF 파일에서 텍스트 찾기 및 바꾸기
개인정보 및 준수 보장: PDF 파일을 게시하거나 공유하기 전에 개인 정보 또는 기밀 데이터를 쉽게 제거하십시오.
문서를 효율적으로 업데이트하기: 대량의 파일에서 오래된 용어나 내용을 자동으로 교체합니다.
유연한 텍스트 검색 옵션: 포괄적인 삭제를 위해 정확한 구문 일치와 정규 표현식을 모두 활용하십시오.
문서 무결성 보존: 내용을 교체하는 동안 원래의 레이아웃과 형식을 유지하십시오.
PDF에서 텍스트 찾기 및 바꾸기 - C# 사용하기 - SDK 설치
You have to configure Conholdate.Total for .NET to find and replace text in PDF documents. Download the DLL file from the New Releases section or use the below NuGet installation command in MS Visual Studio:
Install-Package Conholdate.Total
C#를 사용하여 PDF에서 단어 찾기 및 바꾸기
민감한 정보(예: 이름, 연락처, 조직 식별자)가 포함된 PDF 문서를 처리할 때, 파일을 공유하기 전에 이러한 단어를 수정하거나 교체할 필요가 종종 있습니다. Conholdate.Total for .NET SDK는 이를 달성하는 간단한 방법을 제공합니다. 다음 예제는 단어나 구문의 정확한 일치를 검색하고 이를 자리 표시자 또는 대체 텍스트로 교체하는 방법을 보여줍니다.
// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
이 코드 조각에서 SDK는 PDF 파일에서 “John Doe"라는 문구를 검색하고 모든 인스턴스를 “[censored]“라는 용어로 바꿉니다. 이 작업은 문서에서 개인 식별 정보를 자동으로 제거하는 데 특히 유용합니다. AddSuffix 옵션은 편집된 버전을 새 파일로 저장하여 원본 파일이 손상되지 않도록 보장하며, RasterizeToPDF 플래그는 출력을 이미지로 변환하는 대신 텍스트 기반 PDF로 유지합니다.
PDF에서 정규 표현식을 사용하여 텍스트 찾기 및 교체 C#로
때때로 PDF에서 교체해야 하는 텍스트는 고정 형식을 따르지 않습니다. 예를 들어, 송장 번호, 우편번호 또는 식별 번호와 같은 패턴은 문서마다 다를 수 있습니다. 이런 상황에서 정규 표현식은 동적 솔루션을 제공합니다. Conholdate.Total for .NET SDK는 개발자가 PDF 내에서 복잡한 텍스트 구조를 감지하고 교체하기 위한 regex 패턴을 정의할 수 있도록 합니다.
// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}
이 코드에서 사용되는 정규 표현식은 은행 참조 또는 거래 식별자와 같은 형식이 지정된 코드에 일반적으로 사용되는 패턴과 일치합니다. 이 패턴에 맞는 텍스트는 자동으로 찾아지며 “[censored]“와 같은 미리 정의된 레이블로 교체됩니다. 이러한 유연성 수준은 사전 내용이 정확히 무엇인지 모르더라도 민감한 정보를 보호할 수 있도록 보장합니다.
결론
PDF 문서에서 C#을 사용하여 텍스트를 찾고 교체하는 것이 Conholdate.Total for .NET에서 제공하는 기능 덕분에 그 어느 때보다 쉬워졌습니다. 특정 단어를 교체하든 정규 표현식을 사용하여 가변 패턴을 검색하든, 이 SDK는 PDF 콘텐츠를 정밀하고 제어된 방식으로 조작할 수 있도록 보장합니다. 민감한 정보를 삭제하고, 업데이트를 자동화하며, 문서 형식을 유지하는 기능은 모든 산업의 개발자에게 강력한 도구가 됩니다. 오늘 C# 프로젝트에 통합하여 문서 처리 워크플로를 자신 있게 간소화하세요.