오늘날의 디지털 시대에 기업과 개인은 대량의 송장과 영수증을 처리하는 경우가 많습니다. 이러한 문서의 데이터를 회계 또는 관리 시스템에 수동으로 입력하는 것은 시간이 많이 걸리고 오류가 발생하기 쉽습니다. 다행히 OCR(광학 문자 인식) 기술은 스캔하거나 사진을 찍은 송장에서 텍스트와 데이터를 추출하여 이 프로세스를 자동화하는 데 도움이 될 수 있습니다. 이 블로그 게시물에서는 C#에서 OCR을 사용하여 송장 스캐너를 만드는 과정을 안내하여 금융 워크플로에서 시간을 절약하고 오류를 줄일 수 있도록 도와드립니다.
OCR 송장 스캐너 - C# API 설치
프로젝트에서 OCR을 사용하려면 Conholdate.Total for .NET을 설치해야 합니다. Visual Studio의 NuGet 패키지 관리자 플러그인을 통해 이 작업을 수행하거나 다음 설치 명령을 실행할 수 있습니다.
PM> NuGet\Install-Package Conholdate.Total
C#에서 OCR 영수증 스캐너 만들기
영수증은 이미지 형태로 공유되는 경우가 많습니다. 아래 단계에 따라 C#에서 OCR을 사용하여 영수증 이미지를 처리하는 영수증 스캐너를 쉽게 만들 수 있습니다.
- OcrInput 클래스의 인스턴스를 초기화합니다.
- 소스 이미지를 추가합니다.
- OCR을 사용하여 송장에서 텍스트를 추출합니다.
- 송장 텍스트를 파일에 저장합니다.
아래 코드 조각은 C#에서 OCR 영수증 스캐너를 만드는 방법을 보여줍니다.
// 송장 이미지 로드
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");
// 송장에서 텍스트 추출
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// 송장 텍스트를 파일에 저장
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);
C#에서 PDF용 OCR을 사용하여 송장 스캐너 만들기
영수증과 청구서는 여러 페이지에 여러 청구서를 포함할 수 있는 PDF 문서로 컴파일되는 경우가 있습니다. C#에서 PDF용 OCR을 사용하여 송장 스캐너를 효율적으로 만들 수 있습니다. 귀하의 환경에서 PDF 송장을 처리하려면 아래 단계를 따르십시오.
- OcrInput 클래스의 인스턴스를 만듭니다.
- 소스 PDF 파일을 로드합니다.
- 송장에서 텍스트를 읽습니다.
- 송장 텍스트를 TXT 파일로 내보냅니다.
아래 코드 샘플은 C#에서 PDF용 OCR을 사용하여 송장 스캐너를 만드는 방법을 보여줍니다.
// 송장 PDF 로드
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");
// 송장에서 텍스트 추출
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// 송장 텍스트를 파일에 저장
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);
무료 평가판 라이센스
API를 전체 성능으로 테스트하기 위한 무료 평가판 라이센스를 얻을 수 있습니다.
합산
C#에서 OCR을 사용하여 송장에서 데이터를 스캔하고 추출하는 프로세스를 자동화하면 재무 워크플로를 크게 간소화하고 수동 오류의 위험을 줄일 수 있습니다. 이 블로그 게시물에서는 C#에서 OCR을 사용하여 송장 스캐너를 만드는 방법에 대한 기본 개요를 제공했습니다. 비즈니스 또는 프로젝트의 특정 요구 사항을 충족하도록 이 솔루션을 더욱 강화하고 사용자 정의할 수 있습니다. 예를 들어, 하나 또는 여러 개의 영수증 이미지를 즉석에서 처리하고, 송장이 포함된 PDF 문서, 압축 또는 보관된 영수증용 ZIP 디렉터리를 사용할 수 있습니다. 마찬가지로 요구 사항에 따라 크기 조정, 리샘플링, 자르기 등과 같은 OCR 작업을 위해 영수증 이미지를 사전 처리하도록 강화할 수 있습니다. 그러나 귀하의 질문이나 우려 사항에 대해 논의하고 싶은 경우 포럼에 편지를 보내실 수 있습니다.
자주 묻는 질문
OCR이란 무엇이며 송장 스캐너에 사용되는 이유는 무엇입니까?
OCR은 광학 문자 인식(Optical Character Recognition)을 의미하며, 이미지나 스캔한 문서를 편집 및 검색 가능한 텍스트로 변환하는 기술입니다. 송장 스캐너에서 OCR은 송장에서 텍스트를 추출하는 데 사용되므로 송장 데이터를 디지털 방식으로 더 쉽게 처리하고 관리할 수 있습니다.
OCR을 사용하여 C#에서 송장 스캐너를 생성하려면 어떤 단계가 필요합니까?
일반적인 단계에는 이미지 획득, OCR 텍스트 추출, 데이터 검증 및 구문 분석, 추출된 데이터를 구조화된 형식으로 저장하는 작업이 포함됩니다. 또한 사용자 상호 작용을 위해 사용자 친화적인 인터페이스를 디자인해야 합니다.
C#에서 OCR을 사용하여 송장 스캐너를 구축할 때 직면할 수 있는 몇 가지 문제는 무엇입니까?
다양한 송장 형식 처리, 다양한 이미지 품질 처리, 높은 OCR 정확성 보장, 데이터 검증 및 오류 처리 구현 등의 과제가 있을 수 있습니다.