Modificare il contenuto di un PDF programmaticamente può essere essenziale in scenari in cui informazioni sensibili o obsolete devono essere sostituite prima della distribuzione. Una delle funzionalità più pratiche nella manipolazione dei PDF è la possibilità di cercare una frase o un modello specifico e sostituirlo con contenuti alternativi. In questa guida dettagliata, dimostreremo come è possibile trovare e sostituire testo nei file PDF utilizzando C#. L’accento sarà posto sull’utilizzo del potente Conholdate.Total per .NET SDK, che consente agli sviluppatori di eseguire compiti di manipolazione di documenti robusti, tra cui la redazione e la sostituzione con solo poche righe di codice.

Copriamo due scenari importanti. Il primo spiegherà come individuare una parola o frase esatta in un PDF e sostituirla. Il secondo illustrerà come utilizzare le espressioni regolari per abbinare e sostituire schemi variabili come numeri di telefono, numeri di conto o altri formati di dati personalizzati.

Perché trovare e sostituire il testo nei file PDF

  • Assicurati della privacy e della conformità: rimuovi facilmente dati personali o riservati prima di pubblicare o condividere file PDF.

  • Aggiorna i documenti in modo efficiente: sostituisci automaticamente termini o contenuti obsoleti in grandi lotti di file.

  • Opzioni flessibili di ricerca testuale: Utilizza sia la corrispondenza di frasi esatte che le espressioni regolari per una redazione completa.

  • Preservare l’integrità del documento: Mantenere il layout e il formato originali mentre si sostituisce il contenuto.

Trova e Sostituisci Testo in PDF usando C# - Installazione SDK

Devi configurare Conholdate.Total per .NET per trovare e sostituire testo nei documenti PDF. Scarica il file DLL dalla sezione Nuove Versioni oppure usa il seguente comando di installazione NuGet in MS Visual Studio:

Install-Package Conholdate.Total

Trova e Sostituisci Parola in PDF usando C#

Quando si tratta di documenti PDF che contengono informazioni sensibili come nomi, dettagli di contatto o identificatori di organizzazioni, c’è spesso la necessità di redigere o sostituire queste parole prima di condividere il file. Conholdate.Total per .NET SDK offre un modo semplice per realizzare questo. Il seguente esempio dimostra come cercare una corrispondenza esatta di una parola o frase e sostituirla con un segnaposto o un testo alternativo.

// Find exact phrase and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

In questo frammento, l’SDK scansiona il file PDF per la frase "John Doe" e sostituisce ogni istanza con il termine "[censored]". Questa operazione è particolarmente utile per automatizzare la rimozione di informazioni identificabili personalmente dai documenti. L’opzione AddSuffix assicura che il file originale rimanga intatto salvando la versione modificata come un nuovo file, mentre il flag RasterizeToPDF mantiene l’output come un PDF basato su testo piuttosto che convertirlo in un’immagine.

Trova e Sostituisci Testo in PDF con Espressioni Regolari in C#

A volte, il testo che deve essere sostituito in un PDF non segue un formato fisso. Ad esempio, modelli come numeri di fattura, codici postali o numeri identificativi possono variare da un documento all’altro. In tali situazioni, le espressioni regolari offrono una soluzione dinamica. Il Conholdate.Total per .NET SDK consente agli sviluppatori di definire modelli regex per rilevare e sostituire strutture di testo complesse all’interno di un PDF.

// Find text using regular expression and replace it with some other text using C#
using (Redactor redactor = new Redactor(@"path/document.pdf"))
{
  redactor.Apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
  redactor.Save(new SaveOptions() { AddSuffix = true, RasterizeToPDF = false });
}

L’espressione regolare utilizzata in questo codice corrisponde a un modello comunemente usato per codici formattati, come riferimenti bancari o identificatori di transazione. Qualsiasi testo che si adatta a questo modello viene automaticamente localizzato e sostituito con un’etichetta predefinita come "[censored]". Questo livello di flessibilità garantisce che tu possa proteggere informazioni sensibili anche quando non conosci il suo contenuto esatto in anticipo.

Conclusione

Trovare e sostituire testo nei documenti PDF utilizzando C# non è mai stato così facile, grazie alle capacità offerte da Conholdate.Total per .NET. Che tu stia sostituendo una parola specifica o cercando modelli variabili con espressioni regolari, questo SDK garantisce che tu possa manipolare il contenuto del tuo PDF con precisione e controllo. La possibilità di oscurare informazioni sensibili, automatizzare aggiornamenti e preservare la formattazione dei documenti rende questo uno strumento potente per gli sviluppatori di vari settori. Integralo nei tuoi progetti C# oggi e semplifica i tuoi flussi di lavoro di elaborazione documentale con fiducia.

See Also