C#で画像をテキストに変換する

C#で画像をテキストに変換する

この.NETOCRライブラリを使用して、スキャンした画像をプログラムで文字列に変換します。このライブラリを使用すると、画像のアルファベットを抽出して整理し、任意のファイル形式で保存するOCR(光学式文字認識)を実行できます。このブログ投稿では、このライブラリを探索し、C#で画像をテキストに変換するためのコードスニペットを記述します。ただし、このライブラリには、画像をスキャンしてプログラムでテキスト形式に変換するためのさまざまな方法が用意されています。

以下の点について説明します。

.NETOCRライブラリのインストール

OCRに対して費用効果が高く堅牢なこのライブラリを使用します。インストールが簡単で、回転した画像を認識するのに役立つ前処理フィルターを提供します。ただし、DLLファイルをダウンロードするか、NuGetパッケージマネージャーで次のコマンドを実行して、このAPIを.NETプロジェクトにインストールできます。

Install-Package Aspose.OCR

C#で画像をテキストに変換する

スキャンした画像からテキストを抽出し、数行のソースコードを記述して、他のファイル形式で保存できます。

次の手順とコードスニペットに従って、プログラムで画像をC#のテキストに変換します。

  1. AsposeOcrのインスタンスを初期化します。
  2. 画像上のテキストを認識するRecognizeImageメソッドを呼び出して、ソース画像ファイルをロードします。
  3. テキストを表示します。
// AsposeOcrのインスタンスを初期化します 
AsposeOcr api = new AsposeOcr();
// 画像上のテキストを認識するRecognizeImageメソッドを呼び出して、ソース画像ファイルをロードします 
string result = api.RecognizeImage("sample.png");
// 認識されたテキストを表示する
Console.WriteLine(result);

1行を含む画像に対するOCR操作

このライブラリを使用すると、1行のみを含む画像に対してOCR操作を実行できます。以下に説明する次の手順に従うことができます。

  1. AsposeOcrクラスのオブジェクトを作成します。
  2. 1行のテキストを含む画像を認識するRecognizeLineメソッドを呼び出します。
  3. 認識されたテキストを表示します。
// AsposeOcrクラスのオブジェクトを作成します 
AsposeOcr api = new AsposeOcr();
// 1行のテキストを含む画像を認識するRecognizeLineメソッドを呼び出します。 
string result = api.RecognizeLine("sample.png");
// 認識されたテキストを表示する
Console.WriteLine(result);

ストリームからの画像に対してOCRを実行する

ストリーム内の画像に対して光学式文字認識を実行することもできます。上記の最初のセクションで使用したのと同じメソッドが呼び出されます。

手順は次のとおりです。

  1. AsposeOcrクラスのインスタンスをインスタンス化します。
  2. MemoryStreamクラスのコンストラクターを初期化して、ストリームを作成します。
  3. FileStreamコンストラクターを初期化して、ソースイメージファイルをロードします。
  4. CopyToメソッドを呼び出して、現在のストリームのバイトをメモリストリームに書き込みます。
  5. RecognizeImageメソッドを呼び出して、画像からテキストを読み取ります。
string result = "";
// AsposeOcrクラスのインスタンスをインスタンス化します 
AsposeOcr api = new AsposeOcr();
// MemoryStreamクラスのコンストラクターを初期化してストリームを作成します 
using (MemoryStream ms = new MemoryStream())
// FileStreamコンストラクターを初期化してソースイメージファイルをロードします  
using (FileStream file = new FileStream(  "sample.png", FileMode.Open, FileAccess.Read))
{
    // CopyToメソッドを呼び出して、現在のストリームのバイトをメモリストリームに書き込みます 
    file.CopyTo(ms);
    // RecognizeImageメソッドを呼び出して、画像からテキストを読み取ります  
    result = api.RecognizeImage(ms);
}
// 認識されたテキストを表示する
Console.WriteLine(result);

無料ライセンスを取得する

無料の一時ライセンスを取得して、評価の制限なしでAPIを試すことができます。

まとめ

これで、このブログ投稿は終わりです。プログラムでC#で画像をテキストに変換する方法を説明しました。さらに、この.NETOCRライブラリが提供するいくつかの高度な方法も実行しました。さらに、ドキュメントにアクセスして、他の機能を確認することもできます。さらに、メソッドの説明とともにコード例を見つけることができますここ。近い将来、他の興味深い記事を公開する予定です。したがって、定期的な更新については、conholdate.comと連絡を取り合ってください。

質問する

あなたは私たちのフォーラムであなたの質問や質問について私たちに知らせることができます。

よくある質問

OCR C#とは何ですか?

光学式文字認識は、スキャンした画像からプログラムでテキストを読み取る技術です。詳細については、このリンクにアクセスしてください。

画像からテキストを読み取るにはどうすればよいですか?

この.NETOCRライブラリのこのRecognizeImageメソッドを使用して、画像をテキストに変換できます。

関連項目