ในยุคดิจิทัลปัจจุบัน ธุรกิจและบุคคลต่างๆ มักจะจัดการกับใบแจ้งหนี้และใบเสร็จรับเงินจำนวนมาก การป้อนข้อมูลจากเอกสารเหล่านี้ลงในระบบบัญชีหรือการจัดการด้วยตนเองอาจใช้เวลานานและเกิดข้อผิดพลาดได้ง่าย โชคดีที่เทคโนโลยีการรู้จำอักขระด้วยแสง (OCR) สามารถช่วยทำให้กระบวนการนี้เป็นอัตโนมัติโดยการแยกข้อความและข้อมูลจากใบแจ้งหนี้ที่สแกนหรือรูปถ่าย ในบล็อกโพสต์นี้ เราจะแนะนำคุณตลอดกระบวนการสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C# ซึ่งช่วยให้คุณประหยัดเวลาและลดข้อผิดพลาดในขั้นตอนการทำงานทางการเงินของคุณ
เครื่องสแกนใบแจ้งหนี้ OCR - การติดตั้ง C# API
หากต้องการใช้ OCR ในโปรเจ็กต์ของคุณ คุณต้องติดตั้ง Conholdate.Total for .NET คุณสามารถทำได้ผ่านปลั๊กอิน NuGet Package Manager ใน Visual Studio หรือเรียกใช้คำสั่งการติดตั้งต่อไปนี้:
PM> NuGet\Install-Package Conholdate.Total
สร้างเครื่องสแกนใบเสร็จรับเงิน OCR ใน C#
ใบเสร็จรับเงินมักจะถูกแชร์ในรูปแบบของรูปภาพ คุณสามารถสร้างเครื่องสแกนใบเสร็จได้อย่างง่ายดายโดยใช้ OCR ใน C# เพื่อประมวลผลภาพใบเสร็จโดยทำตามขั้นตอนด้านล่าง:
- เตรียมใช้งานอินสแตนซ์ของคลาส OcrInput
- เพิ่มอิมเมจต้นฉบับด้วยเมธอด Add(string)
- แยกข้อความจากใบแจ้งหนี้ด้วย OCR ด้วยวิธีการ RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
- บันทึกข้อความใบแจ้งหนี้ลงในไฟล์ด้วยวิธี Save(string, SaveFormat, bool, SpellCheckLanguage, string)
ข้อมูลโค้ดด้านล่างสาธิตวิธีสร้างเครื่องสแกนใบเสร็จ OCR ใน C#:
// โหลดรูปภาพใบแจ้งหนี้
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");
// แยกข้อความออกจากใบแจ้งหนี้
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// บันทึกข้อความใบแจ้งหนี้ลงในไฟล์
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);
สร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR สำหรับ PDF ใน C#
บางครั้งใบเสร็จรับเงินและใบแจ้งหนี้จะถูกรวบรวมเป็นเอกสาร PDF ซึ่งหลายหน้าสามารถมีใบแจ้งหนี้หลายใบได้ คุณสามารถสร้างเครื่องสแกนใบแจ้งหนี้ได้อย่างมีประสิทธิภาพโดยใช้ OCR สำหรับ PDF ใน C# โปรดทำตามขั้นตอนด้านล่างเพื่อประมวลผลใบแจ้งหนี้ PDF ในสภาพแวดล้อมของคุณ:
- สร้างอินสแตนซ์ของคลาส OcrInput
- โหลดไฟล์ PDF ต้นฉบับโดยการระบุการแจงนับ InputType
- อ่านข้อความจากใบแจ้งหนี้โดยใช้วิธี RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
- ส่งออกข้อความใบแจ้งหนี้ไปยังไฟล์ TXT ด้วยการแจงนับ SaveFormat
ตัวอย่างโค้ดด้านล่างแสดงวิธีสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR สำหรับ PDF ใน C#:
// โหลดใบแจ้งหนี้ PDF
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");
// แยกข้อความออกจากใบแจ้งหนี้
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// บันทึกข้อความใบแจ้งหนี้ลงในไฟล์
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);
ใบอนุญาตการประเมินผลฟรี
คุณอาจได้รับ ใบอนุญาตการประเมินฟรี สำหรับการทดสอบ API อย่างเต็มประสิทธิภาพ
สรุป
การทำให้กระบวนการสแกนและดึงข้อมูลจากใบแจ้งหนี้เป็นอัตโนมัติโดยใช้ OCR ใน C# สามารถปรับปรุงขั้นตอนการทำงานทางการเงินของคุณได้อย่างมาก และลดความเสี่ยงของข้อผิดพลาดด้วยตนเอง ในบล็อกโพสต์นี้ เราได้จัดเตรียมโครงร่างพื้นฐานของวิธีสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C# คุณสามารถปรับปรุงและปรับแต่งโซลูชันนี้เพิ่มเติมเพื่อให้ตรงตามความต้องการเฉพาะของธุรกิจหรือโครงการของคุณได้ ตัวอย่างเช่น คุณสามารถปรับแต่งให้ประมวลผลภาพใบเสร็จเดียวหรือหลายภาพ ใช้เอกสาร PDF ที่มีใบแจ้งหนี้ ไดเร็กทอรี ZIP สำหรับใบเสร็จที่บีบอัดหรือเก็บถาวร ในทำนองเดียวกัน คุณสามารถเพิ่มรูปภาพใบเสร็จเพื่อประมวลผลล่วงหน้าสำหรับการดำเนินการ OCR เช่น การปรับขนาด การสุ่มตัวอย่างใหม่ การครอบตัด ฯลฯ ตามความต้องการของคุณ อย่างไรก็ตาม คุณสามารถเขียนถึงเราได้ที่ ฟอรั่ม ในกรณีที่คุณต้องการหารือเกี่ยวกับข้อสงสัยหรือข้อกังวลของคุณ
คำถามที่พบบ่อย
OCR คืออะไร และเหตุใดจึงถูกนำมาใช้ในเครื่องสแกนใบแจ้งหนี้
OCR ย่อมาจาก Optical Character Recognition ซึ่งเป็นเทคโนโลยีที่แปลงรูปภาพหรือเอกสารที่สแกนให้เป็นข้อความที่แก้ไขและค้นหาได้ ในเครื่องสแกนใบแจ้งหนี้ OCR ใช้เพื่อแยกข้อความจากใบแจ้งหนี้ ทำให้ง่ายต่อการประมวลผลและจัดการข้อมูลใบแจ้งหนี้แบบดิจิทัล
ขั้นตอนใดบ้างที่เกี่ยวข้องในการสร้างเครื่องสแกนใบแจ้งหนี้ใน C# ด้วย OCR
ขั้นตอนทั่วไป ได้แก่ การได้มาของรูปภาพ การแยกข้อความ OCR การตรวจสอบความถูกต้องของข้อมูลและการแยกวิเคราะห์ และการจัดเก็บข้อมูลที่แยกออกมาในรูปแบบที่มีโครงสร้าง คุณจะต้องออกแบบอินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้สำหรับการโต้ตอบกับผู้ใช้
ฉันอาจเผชิญกับความท้าทายอะไรบ้างเมื่อสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C#
ความท้าทายอาจรวมถึงการจัดการรูปแบบใบแจ้งหนี้ที่แตกต่างกัน การจัดการกับคุณภาพของภาพที่แตกต่างกัน การรับรองความถูกต้องของ OCR ในระดับสูง และการดำเนินการตรวจสอบข้อมูลและการจัดการข้อผิดพลาด