Kod Java do wyodrębniania tekstu z obrazu

Technologia OCR stała się bardzo popularna i korzystna, szczególnie dla organizacji, które odchodzą od dokumentów papierowych i chcą wyodrębnić ważne dane tekstowe ze zeskanowanych dokumentów, aby zapisać je w istniejącym oprogramowaniu biznesowym. Branża opieki zdrowotnej, kancelarie prawne lub agencje samorządu lokalnego przekształcają swoje ogromne dane w dokumenty cyfrowe z możliwością przeszukiwania.

Podobnie, jeśli szukasz mocnej, ale łatwej biblioteki OCR Java dla swojego projektu oprogramowania, trafiłeś we właściwe miejsce. W tym artykule wyjaśnimy, jak wyodrębnić tekst z obrazów PNG przy użyciu języka Java. Dlatego zeskanuj dokumenty papierowe, takie jak paragony i paszporty, lub zrób zdjęcie tablicy rejestracyjnej samochodu i zapisz je wszystkie jako obrazy PNG. W kolejnych sekcjach wyodrębnimy tekst z tych dokumentów jeden po drugim.

W tym artykule zostaną omówione następujące punkty:

Biblioteka do ekstrakcji tekstu Java PNG — instalacja

W tej sekcji omówimy procedurę instalacji tej biblioteki ekstrakcji tekstu Java PNG. Jeśli używasz Mavena do zarządzania projektem lub aplikacją Java, dodaj następujące konfiguracje w pliku pom.xml.

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

Następnie uruchom następujące polecenia.

mvn clean    
mvn install -U

Konfiguracje dotyczące innych frameworków Java można znaleźć na stronie releases.conholdate.com.

Samouczek Java: rozpoznawanie i wyodrębnianie tekstu z PNG

W tej sekcji dowiesz się, jak wyodrębnić tekst z obrazu PNG za pomocą naszej biblioteki ekstrakcji tekstu Java PNG. Wystarczy napisać kilka linijek kodu. Załóżmy, że mamy obraz PNG zawierający tekst podobny do poniższego:

Rozpoznaj i wyodrębnij tekst z PNG za pomocą Java
Poniżej przedstawiono kroki wyodrębniania tekstu z pliku PNG przy użyciu języka Java:

  1. Zainicjuj instancję klasy AsposeOcr.
  2. Pobierz tekst za pomocą metody RecognizeImage(string fullPath) klasy AsposeOcr.
  3. Wydrukuj lub zapisz wyodrębniony tekst.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z pliku PNG przy użyciu języka Java.

// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Przeczytaj tekst z pliku PNG.
string result = recognitionEngine.RecognizeImage("source.png");
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result);

Wyodrębnij tekst z obrazu paragonu za pomocą języka Java

Wiele firm oferuje swoim pracownikom rekompensatę kosztów podróży, opłat sieciowych i innych płatności potwierdzonych rachunkami. Dlatego ręczna digitalizacja tych paragonów może być żmudną i czasochłonną pracą. W tej sekcji wyjaśnimy, jak łatwo możesz zdigitalizować swoje rachunki, korzystając z naszej biblioteki OCR Java.

Poniżej przedstawiono kroki umożliwiające wyodrębnienie tekstu z obrazu paragonu przy użyciu języka Java:

  1. Zainicjuj instancję klasy AsposeOcr.
  2. Utwórz obiekt klasy ReceiptRecognitionSettings.
  3. Określ język za pomocą właściwości ReceiptRecognitionSettings.Language.
  4. Uzyskaj tekst za pomocą metody RecognizeReceipt(string, ReceiptRecognitionSettings) klasy AsposeOcr.
  5. Wydrukuj lub zapisz wyodrębniony tekst.

Poniżej znajduje się kod Java umożliwiający wyodrębnienie tekstu z obrazu (PNG).

// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Ustaw język 
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu paragonu.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);

Wyodrębnianie tekstu ze zdjęcia paszportowego w Javie

Automatyczne rozpoznawanie i weryfikacja paszportu zwykle odbywa się w działach kontroli granicznej, bankowości, bezpieczeństwie i wielu innych wrażliwych działach. W tej sekcji wyjaśnimy, jak szybko można rozpoznać i wyodrębnić tekst z kserokopii paszportu.

Poniżej przedstawiono kroki wyodrębniania tekstu z obrazu PNG paszportu przy użyciu języka Java:

  1. Utwórz instancję klasy AsposeOcr.
  2. Zainicjuj obiekt klasy PassportRecognitionSettings.
  3. Ustaw język za pomocą właściwości PassportRecognitionSettings.Language.
  4. Przeczytaj tekst, korzystając z metody RecognizePassport(string, PassportRecognitionSettings ) klasy AsposeOcr.
  5. Wydrukuj lub zapisz wyodrębniony tekst.

Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z obrazu PNG paszportu przy użyciu języka Java.

// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Ustaw język 
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu paragonu.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);

Podręcznik Java: czytanie tekstu ze zdjęcia tablicy rejestracyjnej pojazdu

W tej sekcji pokażemy, jak wyodrębnić tekst ze zdjęcia samochodu lub dowolnej tablicy rejestracyjnej pojazdu.

Aby wykonać zadanie, wykonaj następujące czynności:

  1. Zainicjuj instancję klasy AsposeOcr.
  2. Utwórz obiekt klasy CarPlateRecognitionSettings .
  3. Ustaw język za pomocą właściwości CarPlateRecognitionSettings.Language.
  4. Wyodrębnij tekst za pomocą metody RecognizeCarPlate(string, CarPlateRecognitionSettings) klasy AsposeOcr.
  5. Wydrukuj lub zapisz wyodrębniony tekst.

Poniższy przykładowy kod ilustruje sposób wyodrębnienia tekstu z obrazu PNG tablicy rejestracyjnej pojazdu przy użyciu języka Java.

// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.CarPlateRecognitionSettings recognitionSettings = new Aspose.OCR.CarPlateRecognitionSettings();
// Ustaw język 
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu tablicy rejestracyjnej.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeCarPlate("car-plate.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);

Zdobądź bezpłatną licencję

Możesz uzyskać bezpłatną licencję tymczasową, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.

Wniosek

Podsumowując, mamy nadzieję, że nauczyłeś się rozpoznawać i wyodrębniać tekst z obrazów PNG w Javie, korzystając z naszej biblioteki rozpoznawania i ekstrakcji tekstu Java PNG. Zademonstrowaliśmy prosty samouczek Java umożliwiający czytanie tekstu z pliku PNG. Podobnie wyjaśniliśmy, jak wyodrębnić tekst ze zeskanowanych kopii rachunków, paszportów i tablic rejestracyjnych pojazdów.

Możesz odwiedzić dokumentację, aby dowiedzieć się więcej o interfejsie API Java Excel Writer.

Na koniec zaglądaj na conholdate.com, aby otrzymywać regularne aktualizacje.

Zadać pytanie

Możesz przekazać nam swoje pytania lub wątpliwości na naszym forum.

Zobacz też