이미지를 텍스트로 변환 Java

스캔한 문서에서 텍스트를 인식하든, 이미지에서 데이터를 추출하든, 이미지를 텍스트로 변환하는 기능은 새로운 가능성을 열어 주었습니다. 이 블로그 게시물에서는 이미지를 Java에서 텍스트로 변환하는 방법과 광학 문자 인식(OCR)을 사용하여 이미지에서 텍스트를 인식하고 추출하는 방법을 알아봅니다.

OCR이란 무엇입니까?

OCR(광학 문자 인식)은 스캔한 종이 문서, PDF, 이미지 등 다양한 유형의 문서를 편집 및 검색 가능한 데이터로 변환하는 기술입니다. 우리의 경우 OCR을 사용하여 Java 이미지에서 텍스트를 인식하는 데 중점을 둘 것입니다.

이미지를 텍스트로 변환하는 이유는 무엇입니까?

이미지를 텍스트로 변환하면 데이터 입력 프로세스가 간소화되고, 이미지에서 텍스트 기반 검색이 가능하며, 이미지 데이터를 다양한 애플리케이션에 쉽게 통합할 수 있습니다. 스캔한 문서, 사진, 스크린샷 등 무엇을 처리하든 이미지에서 텍스트를 읽는 기능은 판도를 바꿀 수 있습니다.

Java에서 OCR을 사용하여 이미지를 텍스트로 변환

Java에서 OCR을 사용하여 이미지를 텍스트로 변환하려면 아래 단계를 따라야 합니다.

  • 시스템에 Conholdate.Total for Java를 설치합니다.
  • AsposeOCR 클래스를 사용하여 OCR API 인스턴스를 만듭니다.
  • RecognitionSettings 클래스를 사용하여 설정을 지정합니다.
  • PreprocessingFilter 클래스 객체를 사용하여 처리 필터를 설정합니다.
  • OcrInput 클래스 인스턴스로 이미지를 준비합니다.
  • Recognize 메서드를 사용하여 이미지를 인식합니다.

아래 코드 조각은 Java에서 이미지를 텍스트로 변환하는 방법을 보여줍니다.

// OCR API 인스턴스 생성
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// 인식 설정 지정
com.aspose.ocr.RecognitionSettings settings = new com.aspose.ocr.RecognitionSettings();
settings.setDetectAreasMode(com.aspose.ocr.DetectAreasMode.PHOTO);
settings.setUpscaleSmallFont(true);

// 처리 필터 설정
com.aspose.ocr.PreprocessingFilter filters = new com.aspose.ocr.PreprocessingFilter();
filters.add(com.aspose.ocr.PreprocessingFilter.AutoDenoising());

// 이미지 준비
com.aspose.ocr.OcrInput images = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage, filters);
images.add("source.png");

// 이미지 인식
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(images, settings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

Java를 사용하여 특정 영역을 처리하여 이미지를 텍스트로 변환

어떤 경우에는 이미지의 특정 영역에서 텍스트를 인식해야 합니다. 따라서 Java에서 OCR을 사용하여 텍스트를 인식하기 위해 하나 이상의 직사각형 좌표를 설정할 수 있습니다. 아래 단계에서는 Java를 사용하여 JPG 또는 PNG 이미지를 텍스트로 변환하는 프로세스를 자세히 설명합니다.

  • 사용자 측에서 Conholdate.Total for Java를 설정합니다.
  • ArrayList 클래스를 사용하여 텍스트가 포함된 직사각형 목록을 준비합니다.
  • OcrInput 클래스를 사용하여 입력 이미지를 준비합니다.
  • AsposeOCR 클래스를 사용하여 API 인스턴스를 만듭니다.
  • RecognitionResult 클래스를 사용하여 텍스트를 인식하고 출력을 가져옵니다.

다음 샘플 코드는 Java를 사용하여 특정 영역을 인식하면서 이미지를 텍스트로 변환하는 방법을 설명합니다.

// 텍스트가 포함된 직사각형 준비
ArrayList rectArray = new ArrayList();
rectArray.add(new java.awt.Rectangle(138, 352, 2033, 537));
rectArray.add(new java.awt.Rectangle(147, 890, 2033, 1157));

// 인식 설정
com.aspose.ocr.RecognitionSettings recognitionSettings = new com.aspose.ocr.RecognitionSettings();
recognitionSettings.setRecognitionAreas(rectArray);

// 이미지 준비
com.aspose.ocr.OcrInput oi = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage);
oi.add("source.png");

// API 인스턴스 생성
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// 이미지 인식
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(oi, recognitionSettings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

무료 평가판 라이센스

평가 제한 없이 Java를 사용하여 이미지를 OCR로 텍스트로 변환할 수 있는 무료 임시 라이센스를 얻을 수 있습니다.

마무리

이번 블로그 게시물에서는 OCR을 사용하여 Java에서 이미지를 텍스트로 변환하는 방법을 살펴보았습니다. 이미지에서 텍스트로의 변환을 애플리케이션에 원활하게 통합할 수 있습니다. JPG, PNG 또는 기타 이미지 형식으로 작업하든 이미지에서 텍스트를 읽는 기능은 데이터 처리 및 분석의 가능성을 열어줍니다. 그러나 요구 사항에 맞게 코드를 맞춤화하거나 질문에 대해 논의하고 싶다면 포럼에 자유롭게 글을 남겨주세요.

또한보십시오