تصویر به متن جاوا

خواه تشخیص متن از اسناد اسکن شده باشد یا استخراج داده ها از تصاویر، توانایی تبدیل تصاویر به متن امکانات جدیدی را در اختیار شما قرار داده است. در این پست وبلاگ، تبدیل یک تصویر به متن در جاوا را یاد می گیریم و استفاده از تشخیص کاراکتر نوری (OCR) برای تشخیص و استخراج متن از تصاویر را بررسی می کنیم.

OCR چیست؟

تشخیص کاراکتر نوری (OCR) یک فناوری است که انواع مختلف اسناد مانند اسناد کاغذی اسکن شده، PDF یا تصاویر را به داده های قابل ویرایش و جستجو تبدیل می کند. در مورد ما، ما بر روی استفاده از OCR برای تشخیص متن از تصاویر در جاوا تمرکز خواهیم کرد.

چرا تبدیل تصویر به متن؟

تبدیل تصاویر به متن می تواند فرآیندهای ورود داده ها را ساده کند، جستجوهای مبتنی بر متن در تصاویر را فعال کند و ادغام داده های تصویر را در برنامه های مختلف تسهیل کند. چه با اسناد اسکن شده، عکس ها یا اسکرین شات ها سر و کار داشته باشید، توانایی خواندن متن از روی تصاویر می تواند بازی را تغییر دهد.

تبدیل تصویر به متن با OCR در جاوا

برای تبدیل تصویر به متن با OCR در جاوا باید مراحل زیر را دنبال کنید:

  • Conholdate.Total for Java را در سیستم خود نصب کنید.
  • یک نمونه از OCR API با کلاس AsposeOCR ایجاد کنید.
  • تنظیمات را با کلاس RecognitionSettings مشخص کنید.
  • فیلترهای پردازش را با استفاده از شی کلاس PreprocessingFilter تنظیم کنید.
  • تصویر را با نمونه کلاس OcrInput آماده کنید.
  • با روش Recognize تصاویر را تشخیص دهید.

قطعه کد زیر نحوه تبدیل تصویر به متن در جاوا را نشان می دهد:

// نمونه ای از OCR API را ایجاد کنید
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// تنظیمات تشخیص را مشخص کنید
com.aspose.ocr.RecognitionSettings settings = new com.aspose.ocr.RecognitionSettings();
settings.setDetectAreasMode(com.aspose.ocr.DetectAreasMode.PHOTO);
settings.setUpscaleSmallFont(true);

// فیلترهای پردازش را تنظیم کنید
com.aspose.ocr.PreprocessingFilter filters = new com.aspose.ocr.PreprocessingFilter();
filters.add(com.aspose.ocr.PreprocessingFilter.AutoDenoising());

// تصویر را آماده کنید
com.aspose.ocr.OcrInput images = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage, filters);
images.add("source.png");

// تشخیص تصاویر
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(images, settings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

با پردازش منطقه خاص با استفاده از جاوا، تصویر را به متن تبدیل کنید

در موارد خاص، شما باید متن را از یک منطقه خاص از تصویر تشخیص دهید. بر این اساس، می توانید یک یا چند مختصات مستطیلی را برای تشخیص متن با استفاده از OCR در جاوا تنظیم کنید. مراحل زیر در مورد فرآیند تبدیل تصویر JPG یا PNG به متن با استفاده از جاوا توضیح می دهد:

  • Conholdate.Total for Java را در انتهای خود راه اندازی کنید.
  • با استفاده از کلاس ArrayList لیست مستطیل های حاوی متون را آماده کنید.
  • تصویر ورودی را با کلاس OcrInput آماده کنید.
  • نمونه API را با کلاس AsposeOCR ایجاد کنید.
  • متن را تشخیص دهید و با کلاس RecognitionResult خروجی بگیرید.

کد نمونه زیر نحوه تبدیل یک تصویر به متن را در حین شناسایی مناطق خاص با استفاده از جاوا توضیح می دهد:

// مستطیل ها را با متن آماده کنید
ArrayList rectArray = new ArrayList();
rectArray.add(new java.awt.Rectangle(138, 352, 2033, 537));
rectArray.add(new java.awt.Rectangle(147, 890, 2033, 1157));

// تنظیمات را برای تشخیص تنظیم کنید
com.aspose.ocr.RecognitionSettings recognitionSettings = new com.aspose.ocr.RecognitionSettings();
recognitionSettings.setRecognitionAreas(rectArray);

// تصویر را آماده کنید
com.aspose.ocr.OcrInput oi = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage);
oi.add("source.png");

// ایجاد نمونه API
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// تشخیص تصاویر
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(oi, recognitionSettings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

مجوز ارزیابی رایگان

ممکن است برای تبدیل تصاویر به متن با OCR با استفاده از جاوا بدون هیچ گونه محدودیت ارزیابی، یک مجوز موقت رایگان دریافت کنید.

بسته بندی

در این پست وبلاگ، تبدیل تصاویر به متن در جاوا با استفاده از OCR را بررسی کردیم. شما می توانید به طور یکپارچه تبدیل تصویر به متن را در برنامه های خود ادغام کنید. چه با فرمت‌های JPG، PNG یا سایر فرمت‌های تصویر کار می‌کنید، توانایی خواندن متن از تصاویر دنیایی از امکانات را برای پردازش و تجزیه و تحلیل داده‌ها باز می‌کند. با این حال، اگر می‌خواهید کد را مطابق با نیازهای خود تنظیم کنید یا در مورد سؤالات خود بحث کنید، می‌توانید برای ما در [فروم 3 بنویسید.

همچنین ببینید