
Technologia OCR stała się bardzo popularna i korzystna, szczególnie dla organizacji, które odchodzą od dokumentów papierowych i chcą wyodrębnić ważne dane tekstowe ze zeskanowanych dokumentów, aby zapisać je w istniejącym oprogramowaniu biznesowym. Branża opieki zdrowotnej, kancelarie prawne lub agencje samorządu lokalnego przekształcają swoje ogromne dane w dokumenty cyfrowe z możliwością przeszukiwania.
Podobnie, jeśli szukasz mocnej, ale łatwej biblioteki OCR Java dla swojego projektu oprogramowania, trafiłeś we właściwe miejsce. W tym artykule wyjaśnimy, jak wyodrębnić tekst z obrazów PNG przy użyciu języka Java. Dlatego zeskanuj dokumenty papierowe, takie jak paragony i paszporty, lub zrób zdjęcie tablicy rejestracyjnej samochodu i zapisz je wszystkie jako obrazy PNG. W kolejnych sekcjach wyodrębnimy tekst z tych dokumentów jeden po drugim.
W tym artykule zostaną omówione następujące punkty:
- Instalacja biblioteki ekstrakcji tekstu Java PNG
- Rozpoznaj i wyodrębnij tekst z PNG w Javie
- Wyodrębnij tekst z obrazu paragonu
- Wyodrębnianie tekstu ze zdjęcia paszportowego
- Wyodrębnianie tekstu ze zdjęcia tablicy rejestracyjnej pojazdu
Biblioteka do ekstrakcji tekstu Java PNG — instalacja
W tej sekcji omówimy procedurę instalacji tej biblioteki ekstrakcji tekstu Java PNG. Jeśli używasz Mavena do zarządzania projektem lub aplikacją Java, dodaj następujące konfiguracje w pliku pom.xml.
<repository>
<id>ConholdateJavaAPI</id>
<name>Conholdate Java API</name>
<url>https://releases.conholdate.com/java/repo</url>
</repository>
<dependency>
<groupId>com.conholdate</groupId>
<artifactId>conholdate-total</artifactId>
<version>23.6</version>
<type>pom</type>
</dependency>
Następnie uruchom następujące polecenia.
mvn clean
mvn install -U
Konfiguracje dotyczące innych frameworków Java można znaleźć na stronie releases.conholdate.com.
Samouczek Java: rozpoznawanie i wyodrębnianie tekstu z PNG
W tej sekcji dowiesz się, jak wyodrębnić tekst z obrazu PNG za pomocą naszej biblioteki ekstrakcji tekstu Java PNG. Wystarczy napisać kilka linijek kodu. Załóżmy, że mamy obraz PNG zawierający tekst podobny do poniższego:

- Zainicjuj instancję klasy AsposeOcr.
- Pobierz tekst za pomocą metody RecognizeImage(string fullPath) klasy AsposeOcr.
- Wydrukuj lub zapisz wyodrębniony tekst.
Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z pliku PNG przy użyciu języka Java.
// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Przeczytaj tekst z pliku PNG.
string result = recognitionEngine.RecognizeImage("source.png");
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result);
Wyodrębnij tekst z obrazu paragonu za pomocą języka Java
Wiele firm oferuje swoim pracownikom rekompensatę kosztów podróży, opłat sieciowych i innych płatności potwierdzonych rachunkami. Dlatego ręczna digitalizacja tych paragonów może być żmudną i czasochłonną pracą. W tej sekcji wyjaśnimy, jak łatwo możesz zdigitalizować swoje rachunki, korzystając z naszej biblioteki OCR Java.
Poniżej przedstawiono kroki umożliwiające wyodrębnienie tekstu z obrazu paragonu przy użyciu języka Java:
- Zainicjuj instancję klasy AsposeOcr.
- Utwórz obiekt klasy ReceiptRecognitionSettings.
- Określ język za pomocą właściwości ReceiptRecognitionSettings.Language.
- Uzyskaj tekst za pomocą metody RecognizeReceipt(string, ReceiptRecognitionSettings) klasy AsposeOcr.
- Wydrukuj lub zapisz wyodrębniony tekst.
Poniżej znajduje się kod Java umożliwiający wyodrębnienie tekstu z obrazu (PNG).
// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Ustaw język
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu paragonu.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);
Wyodrębnianie tekstu ze zdjęcia paszportowego w Javie
Automatyczne rozpoznawanie i weryfikacja paszportu zwykle odbywa się w działach kontroli granicznej, bankowości, bezpieczeństwie i wielu innych wrażliwych działach. W tej sekcji wyjaśnimy, jak szybko można rozpoznać i wyodrębnić tekst z kserokopii paszportu.
Poniżej przedstawiono kroki wyodrębniania tekstu z obrazu PNG paszportu przy użyciu języka Java:
- Utwórz instancję klasy AsposeOcr.
- Zainicjuj obiekt klasy PassportRecognitionSettings.
- Ustaw język za pomocą właściwości PassportRecognitionSettings.Language.
- Przeczytaj tekst, korzystając z metody RecognizePassport(string, PassportRecognitionSettings ) klasy AsposeOcr.
- Wydrukuj lub zapisz wyodrębniony tekst.
Poniższy przykładowy kod pokazuje, jak wyodrębnić tekst z obrazu PNG paszportu przy użyciu języka Java.
// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Ustaw język
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu paragonu.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);
Podręcznik Java: czytanie tekstu ze zdjęcia tablicy rejestracyjnej pojazdu
W tej sekcji pokażemy, jak wyodrębnić tekst ze zdjęcia samochodu lub dowolnej tablicy rejestracyjnej pojazdu.
Aby wykonać zadanie, wykonaj następujące czynności:
- Zainicjuj instancję klasy AsposeOcr.
- Utwórz obiekt klasy CarPlateRecognitionSettings .
- Ustaw język za pomocą właściwości CarPlateRecognitionSettings.Language.
- Wyodrębnij tekst za pomocą metody RecognizeCarPlate(string, CarPlateRecognitionSettings) klasy AsposeOcr.
- Wydrukuj lub zapisz wyodrębniony tekst.
Poniższy przykładowy kod ilustruje sposób wyodrębnienia tekstu z obrazu PNG tablicy rejestracyjnej pojazdu przy użyciu języka Java.
// Utwórz instancję obiektu klasy AsposeOcr.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Utwórz obiekt klasy ReceiptRecognitionSettings.
Aspose.OCR.CarPlateRecognitionSettings recognitionSettings = new Aspose.OCR.CarPlateRecognitionSettings();
// Ustaw język
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Przeczytaj tekst z obrazu tablicy rejestracyjnej.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeCarPlate("car-plate.png", recognitionSettings);
// Wydrukuj wyodrębniony tekst.
Console.WriteLine(result.RecognitionText);
Zdobądź bezpłatną licencję
Możesz uzyskać bezpłatną licencję tymczasową, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.
Wniosek
Podsumowując, mamy nadzieję, że nauczyłeś się rozpoznawać i wyodrębniać tekst z obrazów PNG w Javie, korzystając z naszej biblioteki rozpoznawania i ekstrakcji tekstu Java PNG. Zademonstrowaliśmy prosty samouczek Java umożliwiający czytanie tekstu z pliku PNG. Podobnie wyjaśniliśmy, jak wyodrębnić tekst ze zeskanowanych kopii rachunków, paszportów i tablic rejestracyjnych pojazdów.
Możesz odwiedzić dokumentację, aby dowiedzieć się więcej o interfejsie API Java Excel Writer.
Na koniec zaglądaj na conholdate.com, aby otrzymywać regularne aktualizacje.
Zadać pytanie
Możesz przekazać nam swoje pytania lub wątpliwości na naszym forum.