Java を使用して PNG からテキストを抽出する

OCR テクノロジは、特に紙のドキュメントから離れ、スキャンしたドキュメントから重要なテキスト データを抽出して既存のビジネス ソフトウェアに保存したい組織にとって、非常に人気があり有益になっています。医療業界、法律事務所、または地方政府機関は、膨大な記録を検索可能なデジタル ドキュメントに変換できます。ドキュメントは、多くの安価な光学デバイスを使用してスキャンできます。強力な OCR ソフトウェアには、携帯電話のカメラからの画像でも十分です。 同様に、ソフトウェア プロジェクト用の強力で簡単な OCR Java ライブラリを探している場合は、適切な場所にたどり着きました。この記事では、Java を使用して PNG 画像からテキストを抽出する方法について説明します。そのため、領収書やパスポートなどの紙の文書をスキャンするか、車のナンバー プレートを撮影して、それらすべてを PNG 画像として保存します。以下のセクションでは、これらのドキュメントからテキストを 1 つずつ抽出します。

この記事では、次の点について説明します。

Java PNG テキスト抽出ライブラリ - インストール

このセクションでは、この Java PNG テキスト抽出ライブラリ の手順について説明します。 Maven を使用して Java プロジェクトまたはアプリを管理している場合は、pom.xml ファイルに次の構成を追加します。

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

次に、次のコマンドを実行します。

mvn clean    
mvn install -U

他の Java フレームワークに関する構成については、releases.conholdate.com にアクセスしてください。

Java チュートリアル: PNG からのテキストの認識と抽出

このセクションでは、Java PNG テキスト抽出ライブラリを使用して PNG 画像からテキストを抽出する方法を学習します。数行のコードを記述するだけです。以下のようなテキストを含む PNG 画像があるとします。

Java を使用して PNG からテキストを認識して抽出する
以下は、Java を使用して PNG からテキストを抽出する手順です。

  1. AsposeOcr クラスのインスタンスを初期化します。
  2. AsposeOcrクラスのRecognizeImage(string fullPath)メソッドでテキストを取得します。
  3. 抽出したテキストを印刷または保存します。

以下のコード サンプルは、Java を使用して PNG からテキストを抽出する方法を示しています。

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Read text from the PNG.
string result = recognitionEngine.RecognizeImage("source.png");
// Print the extracted text.
Console.WriteLine(result);

Java を使用してレシート画像からテキストを抽出する

多くの企業は、出張費、ネットワーク料金、および領収書によって確認されたその他の支払いを従業員に補償することを申し出ています。したがって、これらの領収書を手動でデジタル化することは、多忙で時間のかかる作業になる可能性があります。このセクションでは、OCR Java ライブラリを使用して領収書を簡単にデジタル化する方法について説明します。

以下は、Java を使用して領収書の画像からテキストを抽出する手順です。

  1. AsposeOcr クラスのインスタンスを初期化します。
  2. ReceiptRecognitionSettings クラスのオブジェクトを作成します。
  3. ReceiptRecognitionSettings.Language プロパティで言語を指定します。
  4. AsposeOcrクラスのRecognizeReceipt(string, ReceiptRecognitionSettings)メソッドでテキストを取得します。
  5. 抽出したテキストを印刷または保存します。

以下のコード サンプルは、Java を使用して領収書の画像からテキストを抽出する方法を示しています。

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from reciept image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

Java でパスポートの写真からテキストを抽出する

パスポートの自動認識と検証は、国境管理、銀行、セキュリティ、およびその他の多くの機密部門で一般的に行われています。このセクションでは、パスポートのコピーからテキストを認識して抽出する方法について説明します。

以下は、Java を使用してパスポートの PNG 画像からテキストを抽出する手順です。

  1. AsposeOcr クラスのインスタンスを作成します。
  2. PassportRecognitionSettings クラスのオブジェクトを初期化します。
  3. PassportRecognitionSettings.Language プロパティを使用して言語を設定します。
  4. AsposeOcr クラスの RecognizePassport(string, PassportRecognitionSettings ) メソッドを使用してテキストを読み取ります。
  5. 抽出したテキストを印刷または保存します。

以下のコード サンプルは、Java を使用してパスポートの PNG 画像からテキストを抽出する方法を示しています。

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.ReceiptRecognitionSettings recognitionSettings = new Aspose.OCR.ReceiptRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from reciept image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeReceipt("receipt.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

Java ガイド: 車のナンバー プレートの画像からテキストを読み取る

このセクションでは、車や車のナンバー プレートの写真からテキストを抽出する方法を示します。

ジョブを実行する手順は次のとおりです。

  1. AsposeOcr クラスのインスタンスを初期化します。
  2. CarPlateRecognitionSettings クラスのオブジェクトを作成します。
  3. CarPlateRecognitionSettings.Language プロパティを使用して言語を設定します。
  4. AsposeOcr クラスの RecognizeCarPlate(string, CarPlateRecognitionSettings) メソッドを使用してテキストを抽出します。
  5. 抽出したテキストを印刷または保存します。

以下のコード サンプルは、Java を使用して車両ナンバー プレートの PNG 画像からテキストを抽出する方法を示しています。

// Instantiate an object of AsposeOcr class.
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Create an object of ReceiptRecognitionSettings class.
Aspose.OCR.CarPlateRecognitionSettings recognitionSettings = new Aspose.OCR.CarPlateRecognitionSettings();
// Set the language
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Read the text from number plate image.
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeCarPlate("car-plate.png", recognitionSettings);
// Print the extracted text.
Console.WriteLine(result.RecognitionText);

無料ライセンスを取得する

無料の一時ライセンス を取得して、評価制限なしで API を試すことができます。

結論

最後に、Java PNG テキスト認識および抽出ライブラリを使用して、Java で PNG 画像からテキストを認識して抽出する方法を学習したことを願っています。 PNG からテキストを読み取る簡単な Java チュートリアルを示しました。同様に、領収書、パスポート、車のナンバー プレートのスキャン コピーからテキストを抽出する方法についても説明しました。

Java Excel ライター API の詳細については、ドキュメント を参照してください。

最後に、conholdate.com で定期的な更新をお待ちください。

質問する

フォーラムでご質問やご質問をお知らせください。

関連項目