Afbeelding naar tekst Java

Of het nu gaat om het herkennen van tekst uit gescande documenten of het extraheren van gegevens uit afbeeldingen, de mogelijkheid om afbeeldingen naar tekst te converteren heeft nieuwe mogelijkheden geopend. In deze blogpost leren we een afbeelding naar tekst converteren in Java, waarbij we het gebruik van Optical Character Recognition (OCR) onderzoeken om tekst uit afbeeldingen te herkennen en te extraheren.

Wat is OCR?

Optical Character Recognition (OCR) is een technologie die verschillende soorten documenten, zoals gescande papieren documenten, PDF’s of afbeeldingen, omzet in bewerkbare en doorzoekbare gegevens. In ons geval concentreren we ons op het gebruik van OCR om tekst uit afbeeldingen in Java te herkennen.

Waarom beeld-naar-tekstconversie?

Het converteren van afbeeldingen naar tekst kan gegevensinvoerprocessen stroomlijnen, op tekst gebaseerde zoekopdrachten in afbeeldingen mogelijk maken en de integratie van afbeeldingsgegevens in verschillende toepassingen vergemakkelijken. Of u nu te maken heeft met gescande documenten, foto’s of schermafbeeldingen, de mogelijkheid om tekst uit afbeeldingen te lezen kan een gamechanger zijn.

Converteer afbeelding naar tekst met OCR in Java

U moet de onderstaande stappen volgen om een afbeelding naar tekst te converteren met OCR in Java:

  • Installeer Conholdate.Total voor Java op uw systeem.
  • Maak een exemplaar van de OCR API met de AsposeOCR-klasse.
  • Geef de instellingen op met de klasse RecognitionSettings.
  • Stel verwerkingsfilters in met behulp van het klasseobject PreprocessingFilter.
  • Bereid de afbeelding voor met de OcrInput-klasse-instantie.
  • Herken afbeeldingen met de Herkenmethode.

Het onderstaande codefragment laat zien hoe u een afbeelding naar tekst converteert in Java:

// Maak een exemplaar van de OCR-API
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// Geef herkenningsinstellingen op
com.aspose.ocr.RecognitionSettings settings = new com.aspose.ocr.RecognitionSettings();
settings.setDetectAreasMode(com.aspose.ocr.DetectAreasMode.PHOTO);
settings.setUpscaleSmallFont(true);

// Verwerkingsfilters instellen
com.aspose.ocr.PreprocessingFilter filters = new com.aspose.ocr.PreprocessingFilter();
filters.add(com.aspose.ocr.PreprocessingFilter.AutoDenoising());

// Afbeelding voorbereiden
com.aspose.ocr.OcrInput images = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage, filters);
images.add("source.png");

// Herken afbeeldingen
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(images, settings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

Converteer afbeelding naar tekst door een specifieke regio te verwerken met Java

In bepaalde gevallen moet u tekst uit een specifiek gebied van de afbeelding herkennen. Dienovereenkomstig kunt u een of meerdere rechthoekige coördinaten instellen om tekst te herkennen met behulp van de OCR in Java. De onderstaande stappen gaan dieper in op het proces om JPG- of PNG-afbeeldingen naar tekst te converteren met behulp van Java:

  • Stel Conholdate.Total voor Java aan uw kant in.
  • Bereid de lijst met rechthoeken met teksten voor met behulp van de klasse ArrayList.
  • Bereid de invoerafbeelding voor met de klasse OcrInput.
  • Maak een API-instantie met de AsposeOCR-klasse.
  • Herken tekst en verkrijg de uitvoer met de klasse RecognitionResult.

In de volgende voorbeeldcode wordt uitgelegd hoe u een afbeelding naar tekst converteert terwijl u specifieke regio’s herkent met behulp van Java:

// maak rechthoeken met teksten
ArrayList rectArray = new ArrayList();
rectArray.add(new java.awt.Rectangle(138, 352, 2033, 537));
rectArray.add(new java.awt.Rectangle(147, 890, 2033, 1157));

// Instellingen voor herkenning instellen
com.aspose.ocr.RecognitionSettings recognitionSettings = new com.aspose.ocr.RecognitionSettings();
recognitionSettings.setRecognitionAreas(rectArray);

// Afbeelding voorbereiden
com.aspose.ocr.OcrInput oi = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage);
oi.add("source.png");

// maak een API-instantie
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// Herken afbeeldingen
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(oi, recognitionSettings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

Gratis evaluatielicentie

Mogelijk krijgt u een gratis tijdelijke licentie om afbeeldingen naar tekst te converteren met OCR met behulp van Java, zonder enige evaluatiebeperkingen.

Afsluiten

In deze blogpost hebben we onderzocht hoe u afbeeldingen naar tekst kunt converteren in Java met behulp van OCR. U kunt de conversie van beeld naar tekst naadloos in uw toepassingen integreren. Of u nu met JPG, PNG of andere afbeeldingsformaten werkt, de mogelijkheid om tekst uit afbeeldingen te lezen opent een wereld aan mogelijkheden voor gegevensverwerking en -analyse. Als u de code echter wilt aanpassen aan uw vereisten of uw vragen wilt bespreken, kunt u ons schrijven op het forum.

Zie ook