Scansione fatture OCR

Nell’era digitale di oggi, le aziende e i privati spesso hanno a che fare con un grande volume di fatture e ricevute. L’inserimento manuale dei dati di questi documenti nel sistema contabile o gestionale può richiedere molto tempo ed è soggetto a errori. Fortunatamente, la tecnologia di riconoscimento ottico dei caratteri (OCR) può aiutare ad automatizzare questo processo estraendo testo e dati da fatture scansionate o fotografate. In questo post del blog ti guideremo attraverso il processo di creazione di uno scanner per fatture con OCR in C#, consentendoti di risparmiare tempo e ridurre gli errori nei flussi di lavoro finanziari.

Scanner fatture OCR - Installazione API C#

Per utilizzare l’OCR nel tuo progetto, devi installare Conholdate.Total for .NET. Puoi farlo tramite il plug-in NuGet Package Manager in Visual Studio o eseguire il seguente comando di installazione:

PM> NuGet\Install-Package Conholdate.Total

Crea scanner per ricevute OCR in C#

Le ricevute sono spesso condivise sotto forma di immagini. Puoi creare facilmente uno scanner per ricevute utilizzando l’OCR in C# per elaborare le immagini delle ricevute seguendo i passaggi seguenti:

  • Inizializza un’istanza della classe OcrInput.
  • Aggiungi l’immagine sorgente con il metodo Add(string).
  • Estrai il testo dalla fattura con OCR con il metodo RecognizeInvoice(OcrInput, InvoiceRecognitionSettings).
  • Salva il testo della fattura in un file con il metodo Save(string, SaveFormat, bool, SpellCheckLanguage, string).

Lo snippet di codice seguente mostra come creare uno scanner per ricevute OCR in C#:

// Carica l'immagine della fattura
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
invoices.Add("invoice.png");

// Estrai testo dalla fattura
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// Salva il testo della fattura in un file
results[0].Save("invoice.txt", Aspose.OCR.SaveFormat.Text);

Crea scanner di fatture con OCR per PDF in C#

A volte le ricevute e le fatture vengono compilate in un documento PDF in cui più pagine possono contenere diverse fatture. È possibile creare in modo efficiente uno scanner di fatture utilizzando l’OCR per PDF in C#. Per elaborare le fatture PDF nel tuo ambiente, procedi nel seguente modo:

  • Crea un’istanza della classe OcrInput.
  • Caricare il file PDF di origine specificando l’enumerazione InputType.
  • Leggere il testo dalle fatture utilizzando il metodo RecognizeInvoice(OcrInput, InvoiceRecognitionSettings).
  • Esporta il testo della fattura in un file TXT con enumerazione SaveFormat.

L’esempio di codice seguente mostra come creare uno scanner di fatture con OCR per PDF in C#:

// Carica il PDF della fattura
Aspose.OCR.OcrInput invoices = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.PDF);
invoices.Add(dataDir + "invoice.pdf");

// Estrai testo dalla fattura
Aspose.OCR.AsposeOcr api = new Aspose.OCR.AsposeOcr();
List<Aspose.OCR.RecognitionResult> results = api.RecognizeInvoice(invoices);

// Salva il testo della fattura in un file
results[0].Save(dataDir + "3invoice.txt", Aspose.OCR.SaveFormat.Text);

Licenza di valutazione gratuita

Potresti ottenere una licenza di valutazione gratuita per testare le API al massimo delle loro capacità.

Riassumendo

Automatizzare il processo di scansione ed estrazione dei dati dalle fatture utilizzando l’OCR in C# può semplificare in modo significativo i flussi di lavoro finanziari e ridurre il rischio di errori manuali. In questo post del blog abbiamo fornito una descrizione di base su come creare uno scanner per fatture con OCR in C#. Puoi migliorare e personalizzare ulteriormente questa soluzione per soddisfare i requisiti specifici della tua azienda o progetto. Ad esempio, puoi improvvisarlo per elaborare una o più immagini di ricevute, utilizzare un documento PDF contenente fatture, una directory ZIP per ricevute compresse o archiviate. Allo stesso modo, puoi migliorare le immagini delle ricevute per preelaborarle per operazioni OCR come ridimensionamento, ricampionamento, ritaglio, ecc. in base alle tue esigenze. Tuttavia, puoi scriverci al forum nel caso in cui desideri discutere le tue domande o preoccupazioni.

Domande frequenti

Cos’è l’OCR e perché viene utilizzato in uno scanner per fatture?

OCR sta per riconoscimento ottico dei caratteri, una tecnologia che converte immagini o documenti scansionati in testo modificabile e ricercabile. In uno scanner per fatture, l’OCR viene utilizzato per estrarre il testo dalle fatture, semplificando l’elaborazione e la gestione digitale dei dati delle fatture.

Quali passaggi sono necessari per creare uno scanner di fatture in C# con OCR?

I passaggi tipici includono l’acquisizione delle immagini, l’estrazione del testo OCR, la convalida e l’analisi dei dati e la memorizzazione dei dati estratti in un formato strutturato. Dovrai inoltre progettare un’interfaccia user-friendly per l’interazione dell’utente.

Quali sono alcune sfide che potrei affrontare durante la creazione di uno scanner di fatture con OCR in C#?

Le sfide possono includere la gestione di diversi formati di fattura, la gestione di diverse qualità di immagine, la garanzia di un’elevata precisione dell’OCR e l’implementazione della convalida dei dati e della gestione degli errori.

Guarda anche