Skanowanie faktur OCR

W dzisiejszej erze cyfrowej firmy i osoby fizyczne często mają do czynienia z dużą liczbą faktur i paragonów. Ręczne wprowadzanie danych z tych dokumentów do systemu księgowego lub zarządzania może być czasochłonne i podatne na błędy. Na szczęście technologia optycznego rozpoznawania znaków (OCR) może pomóc zautomatyzować ten proces, wyodrębniając tekst i dane ze zeskanowanych lub sfotografowanych faktur. W tym poście na blogu przeprowadzimy Cię przez proces tworzenia skanera faktur z funkcją OCR w języku C#, co umożliwi Ci zaoszczędzenie czasu i ograniczenie błędów w przepływach finansowych.

Skaner faktur OCR - instalacja API C#

Aby użyć OCR w swoim projekcie, musisz zainstalować Conholdate.Total dla .NET. Możesz to zrobić za pomocą wtyczki NuGet Package Manager w Visual Studio lub uruchomić następujące polecenie instalacyjne:

PM> NuGet\Install-Package Conholdate.Total

Utwórz skaner paragonów OCR w C#

Paragony są często udostępniane w formie zdjęć. Możesz łatwo utworzyć skaner paragonów za pomocą OCR w języku C# do przetwarzania obrazów paragonów, wykonując poniższe kroki:

  • Zainicjuj instancję klasy OcrInput.
  • Dodaj obraz źródłowy za pomocą metody Add(string).
  • Wyodrębnij tekst z faktury za pomocą OCR za pomocą metody RecognizeInvoice(OcrInput, InvoiceRecognitionSettings).
  • Zapisz tekst faktury do pliku metodą Save(string, SaveFormat, bool, SpellCheckLanguage, string).

Poniższy fragment kodu demonstruje, jak utworzyć skaner paragonów OCR w języku C#:

// Załaduj obraz faktury
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");

// Wyodrębnij tekst z faktury
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// Zapisz tekst faktury do pliku
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);

Utwórz skaner faktur za pomocą OCR dla plików PDF w C#

Czasami rachunki i faktury są zestawiane w dokument PDF, w którym wiele stron może zawierać kilka faktur. Możesz efektywnie utworzyć skaner faktur za pomocą OCR dla plików PDF w języku C#. Aby przetwarzać faktury PDF w swoim środowisku, wykonaj poniższe czynności:

  • Utwórz instancję klasy OcrInput.
  • Załaduj źródłowy plik PDF, określając wyliczenie typu wejściowego.
  • Odczytaj tekst z faktur za pomocą metody RecognizeInvoice(OcrInput, InvoiceRecognitionSettings).
  • Eksportuj tekst faktury do pliku TXT z wyliczeniem SaveFormat.

Poniższy przykładowy kod pokazuje, jak utworzyć skaner faktur za pomocą OCR dla plików PDF w języku C#:

// Załaduj fakturę w formacie PDF
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");

// Wyodrębnij tekst z faktury
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// Zapisz tekst faktury do pliku
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);

Bezpłatna licencja ewaluacyjna

Możesz otrzymać bezpłatną licencję ewaluacyjną na testowanie interfejsów API w pełnym zakresie.

Podsumowując

Automatyzacja procesu skanowania i wydobywania danych z faktur za pomocą OCR w C# może znacznie usprawnić przepływy finansowe i zmniejszyć ryzyko błędów ręcznych. W tym poście na blogu przedstawiliśmy podstawowy zarys tworzenia skanera faktur za pomocą OCR w języku C#. Możesz dalej ulepszać i dostosowywać to rozwiązanie, aby spełniało specyficzne wymagania Twojej firmy lub projektu. Możesz na przykład zaimprowizować go do przetwarzania jednego lub wielu obrazów paragonów, użyć dokumentu PDF zawierającego faktury, katalogu ZIP dla skompresowanych lub zarchiwizowanych paragonów. Podobnie możesz ulepszyć obrazy paragonów, aby wstępnie je przetworzyć na potrzeby operacji OCR, takich jak zmiana rozmiaru, ponowne próbkowanie, kadrowanie itp. zgodnie z własnymi wymaganiami. Możesz jednak napisać do nas na forum, jeśli chcesz omówić swoje pytania lub wątpliwości.

Często zadawane pytania

Co to jest OCR i dlaczego jest używany w skanerze faktur?

OCR oznacza optyczne rozpoznawanie znaków, technologię konwertującą obrazy lub zeskanowane dokumenty na tekst, który można edytować i przeszukiwać. W skanerze faktur OCR służy do wyodrębniania tekstu z faktur, co ułatwia cyfrowe przetwarzanie danych fakturowych i zarządzanie nimi.

Jakie kroki obejmuje utworzenie skanera faktur w C# z OCR?

Typowe etapy obejmują pozyskiwanie obrazu, wyodrębnianie tekstu OCR, sprawdzanie poprawności i analizowanie danych oraz przechowywanie wyodrębnionych danych w ustrukturyzowanym formacie. Będziesz także musiał zaprojektować przyjazny dla użytkownika interfejs interakcji z użytkownikiem.

Jakie wyzwania mogę napotkać podczas tworzenia skanera faktur z OCR w C#?

Wyzwania mogą obejmować obsługę różnych formatów faktur, radzenie sobie z różną jakością obrazu, zapewnienie wysokiej dokładności OCR oraz wdrażanie sprawdzania poprawności danych i obsługi błędów.

Zobacz też