Извлечение текста из PNG с помощью Java

Технология OCR стала очень популярной и полезной, особенно для организаций, которые отказываются от бумажных документов и хотят извлечь важные текстовые данные из отсканированного документа, чтобы сохранить их в своем существующем бизнес-программном обеспечении. Отрасль здравоохранения, юридические фирмы или местные органы власти могут преобразовать свои огромные записи в цифровые документы с возможностью поиска. Документы можно сканировать с помощью многих дешевых оптических устройств, даже изображений с камер мобильных телефонов достаточно для сильного программного обеспечения OCR. Точно так же, если вы ищете мощную, но простую библиотеку OCR Java для своего программного проекта, вы попали в нужное место. В этой статье мы объясним, как извлекать текст из изображений PNG с помощью Java. Следовательно, отсканируйте бумажные документы, такие как квитанции и паспорта, или сделайте снимок номерного знака автомобиля и сохраните все их в виде изображений PNG. Мы будем извлекать текст из этих документов один за другим в следующих разделах.

В этой статье будут рассмотрены следующие моменты:

Библиотека извлечения текста Java PNG - Установка

В этом разделе мы обсудим процедуру работы с этой библиотекой извлечения текста PNG для Java. Если вы используете Maven для управления проектом или приложением Java, добавьте следующие конфигурации в файл pom.xml.

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

Затем выполните следующие команды.

mvn clean    
mvn install -U

Для получения информации о других платформах Java посетите releases.conholdate.com.

Учебник по Java: распознавание и извлечение текста из PNG

В этом разделе вы узнаете, как извлечь текст из изображения PNG с помощью нашей библиотеки извлечения текста Java PNG. Просто вам нужно написать несколько строк кода. Предположим, у нас есть изображение PNG, содержащее текст, подобный приведенному ниже:

Распознавание и извлечение текста из PNG с помощью Java
Ниже приведены шаги для извлечения текста из PNG с помощью Java:

  1. Инициализировать экземпляр класса AsposeOcr.
  2. Получите текст с помощью метода RecognizeImage(string fullPath) класса AsposeOcr.
  3. Распечатайте или сохраните извлеченный текст.

Пример кода ниже демонстрирует, как извлечь текст из PNG с помощью Java.

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Read text from the PNG.
string result = recognitionEngine.RecognizeImage("source.png");
// Print the extracted text.
Console.WriteLine(result);

Извлечение текста из изображения чека с использованием Java

Многие фирмы предлагают своим сотрудникам компенсацию командировочных расходов, сетевых сборов и других платежей, подтвержденных квитанциями. Таким образом, оцифровка этих квитанций вручную может быть беспокойной и трудоемкой работой. В этом разделе мы объясним, как легко вы можете оцифровать свои квитанции с помощью нашей библиотеки OCR Java.

Ниже приведены шаги для извлечения текста из изображения чека с помощью Java:

  1. Инициализировать экземпляр класса AsposeOcr.
  2. Создайте объект класса ReceiptRecognitionSettings.
  3. Укажите язык с помощью свойства ReceiptRecognitionSettings.Language.
  4. Получите текст с помощью метода RecognizeReceipt(string, ReceiptRecognitionSettings) класса AsposeOcr.
  5. Распечатайте или сохраните извлеченный текст.

В приведенном ниже примере кода показано, как извлечь текст из изображения чека с помощью Java.

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from reciept image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

Извлечение текста из фотографии паспорта в Java

Автоматическое распознавание и проверка паспорта обычно выполняется в пограничном контроле, банковском деле, службе безопасности и многих других важных отделах. В этом разделе мы объясним, как быстро можно распознать и извлечь текст из ксерокопии паспорта.

Ниже приведены шаги для извлечения текста из PNG-изображения паспорта с использованием Java:

  1. Создайте экземпляр класса AsposeOcr.
  2. Инициализируйте объект класса PassportRecognitionSettings.
  3. Установите язык с помощью свойства PassportRecognitionSettings.Language.
  4. Прочитайте текст, используя метод RecognizePassport(string, PassportRecognitionSettings) класса AsposeOcr.
  5. Распечатайте или сохраните извлеченный текст.

В приведенном ниже примере кода показано, как извлечь текст из PNG-изображения паспорта с помощью Java.

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from reciept image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

Руководство по Java: чтение текста с изображения номерного знака автомобиля

В этом разделе мы покажем, как извлечь текст из изображения автомобиля или любого номерного знака транспортного средства.

Ниже приведены шаги для выполнения работы:

  1. Инициализировать экземпляр класса AsposeOcr.
  2. Создайте объект класса CarPlateRecognitionSettings.
  3. Установите язык с помощью свойства CarPlateRecognitionSettings.Language.
  4. Извлеките текст с помощью метода RecognizeCarPlate(string, CarPlateRecognitionSettings) класса AsposeOcr.
  5. Распечатайте или сохраните извлеченный текст.

В приведенном ниже примере кода показано, как извлечь текст из PNG-изображения номерного знака автомобиля с помощью Java.

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.CarPlateRecognitionSettings recognitionSettings = new Aspose.OCR.CarPlateRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from number plate image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeCarPlate("car-plate.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

Получить бесплатную лицензию

Вы можете получить бесплатную временную лицензию, чтобы опробовать API без ограничений пробной версии.

Заключение

В заключение мы надеемся, что вы научились распознавать и извлекать текст из изображений PNG на Java, используя нашу Java-библиотеку распознавания и извлечения текста PNG. Мы продемонстрировали простой учебник по Java для чтения текста из PNG. Кроме того, мы объяснили, как извлечь текст из отсканированных копий квитанций, паспортов и номерных знаков транспортных средств.

Вы можете посетить документацию, чтобы узнать больше об API Java Excel Writer.

Наконец, следите за обновлениями на conholdate.com, чтобы быть в курсе регулярных обновлений.

Задайте вопрос

Вы можете сообщить нам о своих вопросах или запросах на нашем форуме.

Смотрите также