การสแกนใบแจ้งหนี้ OCR

ในยุคดิจิทัลปัจจุบัน ธุรกิจและบุคคลต่างๆ มักจะจัดการกับใบแจ้งหนี้และใบเสร็จรับเงินจำนวนมาก การป้อนข้อมูลจากเอกสารเหล่านี้ลงในระบบบัญชีหรือการจัดการด้วยตนเองอาจใช้เวลานานและเกิดข้อผิดพลาดได้ง่าย โชคดีที่เทคโนโลยีการรู้จำอักขระด้วยแสง (OCR) สามารถช่วยทำให้กระบวนการนี้เป็นอัตโนมัติโดยการแยกข้อความและข้อมูลจากใบแจ้งหนี้ที่สแกนหรือรูปถ่าย ในบล็อกโพสต์นี้ เราจะแนะนำคุณตลอดกระบวนการสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C# ซึ่งช่วยให้คุณประหยัดเวลาและลดข้อผิดพลาดในขั้นตอนการทำงานทางการเงินของคุณ

เครื่องสแกนใบแจ้งหนี้ OCR - การติดตั้ง C# API

หากต้องการใช้ OCR ในโปรเจ็กต์ของคุณ คุณต้องติดตั้ง Conholdate.Total for .NET คุณสามารถทำได้ผ่านปลั๊กอิน NuGet Package Manager ใน Visual Studio หรือเรียกใช้คำสั่งการติดตั้งต่อไปนี้:

PM> NuGet\Install-Package Conholdate.Total

สร้างเครื่องสแกนใบเสร็จรับเงิน OCR ใน C#

ใบเสร็จรับเงินมักจะถูกแชร์ในรูปแบบของรูปภาพ คุณสามารถสร้างเครื่องสแกนใบเสร็จได้อย่างง่ายดายโดยใช้ OCR ใน C# เพื่อประมวลผลภาพใบเสร็จโดยทำตามขั้นตอนด้านล่าง:

  • เตรียมใช้งานอินสแตนซ์ของคลาส OcrInput
  • เพิ่มอิมเมจต้นฉบับด้วยเมธอด Add(string)
  • แยกข้อความจากใบแจ้งหนี้ด้วย OCR ด้วยวิธีการ RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
  • บันทึกข้อความใบแจ้งหนี้ลงในไฟล์ด้วยวิธี Save(string, SaveFormat, bool, SpellCheckLanguage, string)

ข้อมูลโค้ดด้านล่างสาธิตวิธีสร้างเครื่องสแกนใบเสร็จ OCR ใน C#:

// โหลดรูปภาพใบแจ้งหนี้
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");

// แยกข้อความออกจากใบแจ้งหนี้
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// บันทึกข้อความใบแจ้งหนี้ลงในไฟล์
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);

สร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR สำหรับ PDF ใน C#

บางครั้งใบเสร็จรับเงินและใบแจ้งหนี้จะถูกรวบรวมเป็นเอกสาร PDF ซึ่งหลายหน้าสามารถมีใบแจ้งหนี้หลายใบได้ คุณสามารถสร้างเครื่องสแกนใบแจ้งหนี้ได้อย่างมีประสิทธิภาพโดยใช้ OCR สำหรับ PDF ใน C# โปรดทำตามขั้นตอนด้านล่างเพื่อประมวลผลใบแจ้งหนี้ PDF ในสภาพแวดล้อมของคุณ:

  • สร้างอินสแตนซ์ของคลาส OcrInput
  • โหลดไฟล์ PDF ต้นฉบับโดยการระบุการแจงนับ InputType
  • อ่านข้อความจากใบแจ้งหนี้โดยใช้วิธี RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
  • ส่งออกข้อความใบแจ้งหนี้ไปยังไฟล์ TXT ด้วยการแจงนับ SaveFormat

ตัวอย่างโค้ดด้านล่างแสดงวิธีสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR สำหรับ PDF ใน C#:

// โหลดใบแจ้งหนี้ PDF
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");

// แยกข้อความออกจากใบแจ้งหนี้
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// บันทึกข้อความใบแจ้งหนี้ลงในไฟล์
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);

ใบอนุญาตการประเมินผลฟรี

คุณอาจได้รับ ใบอนุญาตการประเมินฟรี สำหรับการทดสอบ API อย่างเต็มประสิทธิภาพ

สรุป

การทำให้กระบวนการสแกนและดึงข้อมูลจากใบแจ้งหนี้เป็นอัตโนมัติโดยใช้ OCR ใน C# สามารถปรับปรุงขั้นตอนการทำงานทางการเงินของคุณได้อย่างมาก และลดความเสี่ยงของข้อผิดพลาดด้วยตนเอง ในบล็อกโพสต์นี้ เราได้จัดเตรียมโครงร่างพื้นฐานของวิธีสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C# คุณสามารถปรับปรุงและปรับแต่งโซลูชันนี้เพิ่มเติมเพื่อให้ตรงตามความต้องการเฉพาะของธุรกิจหรือโครงการของคุณได้ ตัวอย่างเช่น คุณสามารถปรับแต่งให้ประมวลผลภาพใบเสร็จเดียวหรือหลายภาพ ใช้เอกสาร PDF ที่มีใบแจ้งหนี้ ไดเร็กทอรี ZIP สำหรับใบเสร็จที่บีบอัดหรือเก็บถาวร ในทำนองเดียวกัน คุณสามารถเพิ่มรูปภาพใบเสร็จเพื่อประมวลผลล่วงหน้าสำหรับการดำเนินการ OCR เช่น การปรับขนาด การสุ่มตัวอย่างใหม่ การครอบตัด ฯลฯ ตามความต้องการของคุณ อย่างไรก็ตาม คุณสามารถเขียนถึงเราได้ที่ ฟอรั่ม ในกรณีที่คุณต้องการหารือเกี่ยวกับข้อสงสัยหรือข้อกังวลของคุณ

คำถามที่พบบ่อย

OCR คืออะไร และเหตุใดจึงถูกนำมาใช้ในเครื่องสแกนใบแจ้งหนี้

OCR ย่อมาจาก Optical Character Recognition ซึ่งเป็นเทคโนโลยีที่แปลงรูปภาพหรือเอกสารที่สแกนให้เป็นข้อความที่แก้ไขและค้นหาได้ ในเครื่องสแกนใบแจ้งหนี้ OCR ใช้เพื่อแยกข้อความจากใบแจ้งหนี้ ทำให้ง่ายต่อการประมวลผลและจัดการข้อมูลใบแจ้งหนี้แบบดิจิทัล

ขั้นตอนใดบ้างที่เกี่ยวข้องในการสร้างเครื่องสแกนใบแจ้งหนี้ใน C# ด้วย OCR

ขั้นตอนทั่วไป ได้แก่ การได้มาของรูปภาพ การแยกข้อความ OCR การตรวจสอบความถูกต้องของข้อมูลและการแยกวิเคราะห์ และการจัดเก็บข้อมูลที่แยกออกมาในรูปแบบที่มีโครงสร้าง คุณจะต้องออกแบบอินเทอร์เฟซที่เป็นมิตรต่อผู้ใช้สำหรับการโต้ตอบกับผู้ใช้

ฉันอาจเผชิญกับความท้าทายอะไรบ้างเมื่อสร้างเครื่องสแกนใบแจ้งหนี้ด้วย OCR ใน C#

ความท้าทายอาจรวมถึงการจัดการรูปแบบใบแจ้งหนี้ที่แตกต่างกัน การจัดการกับคุณภาพของภาพที่แตกต่างกัน การรับรองความถูกต้องของ OCR ในระดับสูง และการดำเนินการตรวจสอบข้อมูลและการจัดการข้อผิดพลาด

ดูสิ่งนี้ด้วย