Konwertuj obraz na tekst za pomocą OCR w C#

przekonwertuj obraz na tekst w C#

Programowo przekształć zeskanowany obraz w ciąg znaków, korzystając z tej biblioteki .NET OCR. Ta biblioteka umożliwia wykonanie OCR (optycznego rozpoznawania znaków), podczas którego wyodrębniane są alfabety z obrazów, a następnie porządkowane w celu zapisania w dowolnym formacie pliku. W tym poście na blogu omówimy tę bibliotekę i napiszemy fragment kodu umożliwiający konwersję obrazu na tekst za pomocą OCR w języku C#. Jednakże biblioteka ta oferuje szeroką gamę metod programowego skanowania i konwertowania obrazów do formatu tekstowego.

Omówimy następujące punkty:

Instalacja biblioteki .NET OCR

Będziemy używać tej biblioteki, która jest opłacalna i solidna do OCR. Jest łatwy w instalacji i oferuje filtry wstępnego przetwarzania, które pomagają rozpoznać obrócone obrazy. Możesz jednak pobrać pliki DLL lub uruchomić następujące polecenie w menedżerze pakietów NuGet, aby zainstalować ten interfejs API w projekcie .NET.

Install-Package Aspose.OCR

Konwertuj obraz na tekst za pomocą OCR w C#

Możesz wyodrębnić tekst ze zeskanowanego obrazu i zapisać go w dowolnym innym formacie pliku, pisząc kilka linii kodu źródłowego.

Wykonaj poniższe kroki i fragment kodu, aby programowo przekonwertować obraz na tekst za pomocą OCR w języku C#:

  1. Zainicjuj instancję AsposeOcr.
  2. Załaduj plik obrazu źródłowego, wywołując metodę RecognizeImage, która rozpoznaje tekst na obrazie.
  3. Wyświetl tekst.

Poniższy fragment kodu pokazuje, jak przekonwertować obraz na tekst za pomocą OCR w języku C#:

// Zainicjuj instancję AsposeOcr 
AsposeOcr api = new AsposeOcr();
// Załaduj plik obrazu źródłowego, wywołując metodę RecognizeImage, która rozpoznaje tekst na obrazie 
string result = api.RecognizeImage("sample.png");
// Wyświetl rozpoznany tekst
Console.WriteLine(result);

Operacja OCR na obrazie zawierającym pojedynczą linię tekstu w C#

Ta biblioteka umożliwia wykonywanie operacji OCR na obrazach zawierających tylko jedną linię. Możesz wykonać następujące kroki wymienione poniżej:

  1. Utwórz obiekt klasy AsposeOcr.
  2. Wywołaj metodę RecognizeLine, która rozpoznaje obraz zawierający pojedynczą linię tekstu.
  3. Wyświetl rozpoznany tekst.

Poniższy przykład kodu demonstruje, jak przekonwertować obraz na tekst za pomocą OCR w języku C#, gdzie obraz zawiera tylko jedną linię tekstu:

// Utwórz obiekt klasy AsposeOcr 
AsposeOcr api = new AsposeOcr();
// Wywołaj metodę RecognizeLine, która rozpoznaje obraz zawierający pojedynczą linię tekstu. 
string result = api.RecognizeLine("sample.png");
// Wyświetl rozpoznany tekst
Console.WriteLine(result);

Wykonywanie OCR na obrazie ze strumienia w języku C#

Możesz także wykonać optyczne rozpoznawanie znaków na obrazach w strumieniu. Wywołana zostanie ta sama metoda, która została zastosowana w pierwszej sekcji powyżej.

Oto kroki:

  1. Utwórz instancję klasy AsposeOcr.
  2. Zainicjuj konstruktory klasy MemoryStream, aby utworzyć strumień.
  3. Załaduj plik obrazu źródłowego, inicjując konstruktor FileStream.
  4. Wywołaj metodę CopyTo, aby zapisać bajty bieżącego strumienia do strumienia pamięci.
  5. Wywołaj metodę RecognizeImage, aby odczytać tekst z obrazu.

Przykładowy kod poniżej opisuje sposób konwersji obrazu ze strumienia na tekst poprzez wykonanie OCR w języku C#:

string result = "";
// Utwórz instancję klasy AsposeOcr 
AsposeOcr api = new AsposeOcr();
// Zainicjuj konstruktory klas MemoryStream, aby utworzyć strumień 
using (MemoryStream ms = new MemoryStream())
// Załaduj plik obrazu źródłowego, inicjując konstruktor FileStream  
using (FileStream file = new FileStream(  "sample.png", FileMode.Open, FileAccess.Read))
{
    // Wywołaj metodę CopyTo, aby zapisać bajty bieżącego strumienia do strumienia pamięci 
    file.CopyTo(ms);
    // Wywołaj metodę RecognizeImage, aby odczytać tekst z obrazu  
    result = api.RecognizeImage(ms);
}
// Wyświetl rozpoznany tekst
Console.WriteLine(result);

Zdobądź bezpłatną licencję

Możesz otrzymać bezpłatną licencję tymczasową, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.

Podsumowując

W ten sposób dotarliśmy do końca tego wpisu na blogu. Omówiliśmy, jak programowo przekonwertować obraz na tekst za pomocą OCR w języku C#. Ponadto przeszliśmy przez kilka zaawansowanych metod udostępnianych przez bibliotekę .NET OCR. Ponadto możesz odwiedzić dokumentację, aby poznać inne funkcje. Ponadto możesz znaleźć przykłady kodu wraz z opisami metod tutaj. Wkrótce opublikujemy kolejne ciekawe artykuły. Dlatego pozostań w kontakcie z conholdate.com, aby otrzymywać regularne aktualizacje.

Zadać pytanie

Możesz dać nam znać o swoich pytaniach lub wątpliwościach na naszym forum.

Często zadawane pytania

Co to jest OCR C#?

Optyczne rozpoznawanie znaków to technika programowego odczytywania tekstu ze zeskanowanych obrazów. Możesz odwiedzić ten [link], aby poznać dalsze szczegóły.

Jak odczytać tekst z obrazu?

Możesz użyć tej metody RecognizeImage z tej [biblioteki] OCR .NET OCR, aby przekonwertować obraz na tekst za pomocą OCR.

Zobacz też