Immagine in testo Java

Che si tratti di riconoscere il testo da documenti scansionati o di estrarre dati da immagini, la capacità di convertire immagini in testo ha aperto nuove possibilità. In questo post del blog impareremo a convertire un’immagine in testo in Java, esplorando l’uso del riconoscimento ottico dei caratteri (OCR) per riconoscere ed estrarre il testo dalle immagini.

Cos’è l’OCR?

Il riconoscimento ottico dei caratteri (OCR) è una tecnologia che converte diversi tipi di documenti, come documenti cartacei scansionati, PDF o immagini, in dati modificabili e ricercabili. Nel nostro caso, ci concentreremo sull’utilizzo dell’OCR per riconoscere il testo dalle immagini in Java.

Perché la conversione da immagine a testo?

La conversione di immagini in testo può semplificare i processi di immissione dei dati, consentire ricerche basate su testo nelle immagini e facilitare l’integrazione dei dati di immagine in varie applicazioni. Che tu abbia a che fare con documenti scansionati, fotografie o screenshot, la capacità di leggere il testo dalle immagini può cambiare le regole del gioco.

Converti immagine in testo con OCR in Java

È necessario seguire i passaggi seguenti per convertire un’immagine in testo con OCR in Java:

  • Installa Conholdate.Total per Java nel tuo sistema.
  • Crea un’istanza dell’API OCR con la classe AsposeOCR.
  • Specificare le impostazioni con la classe RecognitionSettings.
  • Imposta i filtri di elaborazione utilizzando l’oggetto della classe PreprocessingFilter.
  • Preparare l’immagine con l’istanza della classe OcrInput.
  • Riconoscere le immagini con il metodo Riconosci.

Lo snippet di codice seguente mostra come convertire l’immagine in testo in Java:

// Crea un'istanza dell'API OCR
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// Specificare le impostazioni di riconoscimento
com.aspose.ocr.RecognitionSettings settings = new com.aspose.ocr.RecognitionSettings();
settings.setDetectAreasMode(com.aspose.ocr.DetectAreasMode.PHOTO);
settings.setUpscaleSmallFont(true);

// Imposta i filtri di elaborazione
com.aspose.ocr.PreprocessingFilter filters = new com.aspose.ocr.PreprocessingFilter();
filters.add(com.aspose.ocr.PreprocessingFilter.AutoDenoising());

// Preparare l'immagine
com.aspose.ocr.OcrInput images = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage, filters);
images.add("source.png");

// Riconoscere le immagini
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(images, settings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

Converti immagine in testo elaborando una regione specifica utilizzando Java

In alcuni casi è necessario riconoscere il testo da una regione specifica dell’immagine. Di conseguenza, è possibile impostare una o più coordinate rettangolari per riconoscere il testo utilizzando l’OCR in Java. I passaggi seguenti illustrano il processo per convertire un’immagine JPG o PNG in testo utilizzando Java:

  • Configura Conholdate.Total for Java sul tuo terminale.
  • Preparare l’elenco dei rettangoli contenenti testi utilizzando la classe ArrayList.
  • Preparare l’immagine di input con la classe OcrInput.
  • Crea un’istanza API con la classe AsposeOCR.
  • Riconoscere il testo e ottenere l’output con la classe RecognitionResult.

Il seguente codice di esempio spiega come convertire un’immagine in testo riconoscendo regioni specifiche utilizzando Java:

// preparare rettangoli con testi
ArrayList rectArray = new ArrayList();
rectArray.add(new java.awt.Rectangle(138, 352, 2033, 537));
rectArray.add(new java.awt.Rectangle(147, 890, 2033, 1157));

// Configurare le impostazioni per il riconoscimento
com.aspose.ocr.RecognitionSettings recognitionSettings = new com.aspose.ocr.RecognitionSettings();
recognitionSettings.setRecognitionAreas(rectArray);

// Preparare l'immagine
com.aspose.ocr.OcrInput oi = new com.aspose.ocr.OcrInput(com.aspose.ocr.InputType.SingleImage);
oi.add("source.png");

// creare un'istanza API
com.aspose.ocr.AsposeOCR api = new com.aspose.ocr.AsposeOCR();

// Riconoscere le immagini
ArrayList<com.aspose.ocr.RecognitionResult> results = api.Recognize(oi, recognitionSettings);
results.forEach((result) ->{
	System.out.println(result.recognitionText);
});

Licenza di valutazione gratuita

Puoi ottenere una licenza temporanea gratuita per convertire le immagini in testo con OCR utilizzando Java senza alcuna restrizione di valutazione.

Avvolgendo

In questo post del blog, abbiamo esplorato la conversione di immagini in testo in Java utilizzando l’OCR. Puoi integrare perfettamente la conversione da immagine a testo nelle tue applicazioni. Che tu stia lavorando con JPG, PNG o altri formati di immagine, la capacità di leggere il testo dalle immagini apre un mondo di possibilità per l’elaborazione e l’analisi dei dati. Tuttavia, se desideri personalizzare il codice per soddisfare le tue esigenze o discutere le tue domande, non esitare a scriverci al forum.

Guarda anche