今日のデジタル時代では、企業や個人は大量の請求書や領収書を扱うことがよくあります。これらの文書から会計システムや管理システムにデータを手動で入力すると、時間がかかり、間違いが発生しやすくなります。幸いなことに、光学式文字認識 (OCR) テクノロジーは、スキャンまたは写真撮影した請求書からテキストとデータを抽出することで、このプロセスを自動化するのに役立ちます。このブログ投稿では、C# で OCR を使用して請求書スキャナーを作成するプロセスを説明し、財務ワークフローで時間を節約し、エラーを削減できるようにします。
OCR 請求書スキャナ - C# API のインストール
プロジェクトで OCR を使用するには、Conholdate.Total for .NET をインストールする必要があります。これは、Visual Studio の NuGet パッケージ マネージャー プラグインを介して行うか、次のインストール コマンドを実行して行うことができます。
PM> NuGet\Install-Package Conholdate.Total
C# で OCR レシート スキャナーを作成する
領収書は画像形式で共有されることがよくあります。以下の手順に従って、C# で OCR を使用してレシート画像を処理するレシート スキャナーを簡単に作成できます。
- OcrInput クラスのインスタンスを初期化します。
- ソース画像を追加します。
- OCR を使用して請求書からテキストを抽出します。
- 請求書のテキストをファイルに保存します。
以下のコード スニペットは、C# で OCR レシート スキャナーを作成する方法を示しています。
// 請求書の画像をロードする
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");
// 請求書からテキストを抽出する
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// 請求書のテキストをファイルに保存する
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);
C# で PDF 用の OCR を使用した請求書スキャナーを作成する
場合によっては、領収書と請求書が PDF ドキュメントにまとめられ、複数のページに複数の請求書が含まれることがあります。 C# で PDF の OCR を使用して請求書スキャナーを効率的に作成できます。お使いの環境で PDF 請求書を処理するには、以下の手順に従ってください。
- OcrInput クラスのインスタンスを作成します。
- ソース PDF ファイルを読み込みます。
- 請求書のテキストを読みます。
- 請求書のテキストを TXT ファイルにエクスポートします。
以下のコード サンプルは、C# で PDF 用の OCR を備えた請求書スキャナーを作成する方法を示しています。
// 請求書 PDF をロードする
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");
// 請求書からテキストを抽出する
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);
// 請求書のテキストをファイルに保存する
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);
無料の評価ライセンス
API を最大限にテストするための 無料評価ライセンス を取得できます。
まとめ
C# の OCR を使用して請求書をスキャンしてデータを抽出するプロセスを自動化すると、財務ワークフローが大幅に合理化され、手動エラーのリスクが軽減されます。このブログ投稿では、C# で OCR を備えた請求書スキャナーを作成する方法の基本的な概要を説明しました。このソリューションをさらに強化およびカスタマイズして、ビジネスまたはプロジェクトの特定の要件を満たすことができます。たとえば、単一または複数の領収書の画像を処理したり、請求書を含む PDF ドキュメントを使用したり、圧縮またはアーカイブされた領収書に ZIP ディレクトリを使用したりするように即興で実行できます。同様に、要件に応じて、サイズ変更、リサンプリング、トリミングなどの OCR 操作用にレシート画像を前処理するように強化できます。ただし、ご質問や懸念事項について話し合いたい場合は、フォーラム までお問い合わせください。
よくある質問
OCR とは何ですか?なぜ請求書スキャナーで OCR が使用されるのですか?
OCR は、Optical Character Recognition (光学式文字認識) の略で、画像またはスキャンした文書を編集可能および検索可能なテキストに変換するテクノロジーです。請求書スキャナでは、OCR を使用して請求書からテキストを抽出し、請求書データのデジタル処理と管理を容易にします。
OCR を使用して C# で請求書スキャナーを作成するにはどのような手順が必要ですか?
一般的な手順には、画像の取得、OCR テキストの抽出、データの検証と解析、抽出されたデータの構造化された形式での保存が含まれます。また、ユーザーとの対話のための使いやすいインターフェイスを設計する必要もあります。
C# で OCR を使用した請求書スキャナーを構築するときに直面する可能性のある課題にはどのようなものがありますか?
課題には、さまざまな請求書形式の処理、さまざまな画質の処理、高い OCR 精度の確保、データ検証とエラー処理の実装などが含まれる場合があります。