在 C# 中将图像转换为文本

在 C# 中将图像转换为文本

使用此 .NET OCR 库 以编程方式将扫描的图像转换为字符串。该库可让您执行 OCR(光学字符识别),其中图像上的字母被提取然后组织以保存为任何文件格式。这篇博文将探索这个库并编写代码片段以在 C# 中将图像转换为文本。但是,该库提供了多种方法来以编程方式扫描图像并将其转换为文本格式。

我们将涵盖以下几点:

.NET OCR 库安装

我们将使用这个对 OCR 具有成本效益且健壮的库。它易于安装并提供有助于识别旋转图像的预处理过滤器。但是,您可以 下载 DLL 文件或在 NuGet 包管理器中运行以下命令,以在您的 .NET 项目中安装此 API。

Install-Package Aspose.OCR

在 C# 中将图像转换为文本

您可以通过编写几行源代码从扫描的图像中提取文本并将其保存为任何其他文件格式。

按照以下步骤和代码片段以编程方式将图像转换为 C# 中的文本:

  1. 初始化 AsposeOcr 的一个实例。
  2. 通过调用识别图像上的文本的 RecognizeImage 方法来加载源图像文件。
  3. 显示文本。
// 初始化 AsposeOcr 的一个实例 
AsposeOcr api = new AsposeOcr();
// 通过调用识别图像上的文本的 RecognizeImage 方法加载源图像文件 
string result = api.RecognizeImage("sample.png");
// 显示识别的文本
Console.WriteLine(result);

对包含单行的图像进行 OCR 操作

该库允许您对仅包含一行的图像执行 OCR 操作。您可以按照下面提到的以下步骤进行操作:

  1. 创建一个 AsposeOcr 类的对象。
  2. 调用 RecognizeLine 方法来识别包含单行文本的图像。
  3. 显示识别的文本。
// 创建 AsposeOcr 类的对象 
AsposeOcr api = new AsposeOcr();
// 调用识别包含单行文本的图像的识别线方法。 
string result = api.RecognizeLine("sample.png");
// 显示识别的文本
Console.WriteLine(result);

对流中的图像执行 OCR

您还可以对流中的图像执行光学字符识别。将调用与上面第一部分中使用的方法相同的方法。

以下是步骤:

  1. 实例化 AsposeOcr 类的实例。
  2. 初始化 MemoryStream 类的构造函数以创建流。
  3. 通过初始化 FileStream 构造函数来加载源图像文件。
  4. 调用CopyTo方法将当前流的字节写入内存流。
  5. 调用 RecognizeImage 方法从图像中读取文本。
string result = "";
// 实例化 AsposeOcr 类的一个实例 
AsposeOcr api = new AsposeOcr();
// 初始化 MemoryStream 类的构造函数以创建流 
using (MemoryStream ms = new MemoryStream())
// 通过初始化 FileStream 构造函数来加载源图像文件  
using (FileStream file = new FileStream(  "sample.png", FileMode.Open, FileAccess.Read))
{
    // 调用 CopyTo 方法将当前流的字节写入内存流 
    file.CopyTo(ms);
    // 调用 RecognizeImage 方法从图像中读取文本  
    result = api.RecognizeImage(ms);
}
// 显示识别的文本
Console.WriteLine(result);

获得免费许可证

您可能会获得 免费临时许可证 来试用 API,而不受评估限制。

加起来

这将我们带到这篇博文的结尾。我们已经了解了如何以编程方式在 C# 中将图像转换为文本。此外,我们还了解了这个 .NET OCR 库提供的一些高级方法。此外,您可以访问 文档 以了解其他功能。此外,您可以在 此处 找到代码示例以及方法描述。我们将在不久的将来发布其他有趣的文章。因此,请与 conholdate.com 保持联系以获取定期更新。

问一个问题

您可以在我们的 论坛 上告诉我们您的问题或疑问。

常见问题

什么是 OCR C#?

光学字符识别是一种以编程方式从扫描图像中读取文本的技术。您可以访问此 链接 以了解更多详细信息。

如何从图像中读取文本?

您可以使用此 .NET OCR RecognizeImage 方法将图像转换为文本。

也可以看看