Modificare il contenuto di un PDF programmaticamente può essere essenziale in scenari in cui informazioni sensibili o obsolete devono essere sostituite prima della distribuzione. Una delle funzionalità più pratiche nella manipolazione dei PDF è la possibilità di cercare una frase o un modello specifico e sostituirlo con contenuto alternativo. In questa guida dettagliata, dimostreremo come è possibile trovare e sostituire il testo nei file PDF utilizzando Java. L’attenzione sarà rivolta all’utilizzo del potente Conholdate.Total per Java SDK, che consente agli sviluppatori di eseguire compiti robusti di manipolazione dei documenti, inclusi la redazione e la sostituzione con poche righe di codice.

Coprirà due scenari importanti. Il primo spiegherà come localizzare una parola o frase esatta in un PDF e sostituirla. Il secondo illustrerà come utilizzare le espressioni regolari per abbinare e sostituire modelli variabili come numeri di telefono, numeri di conto o altri formati di dati personalizzati.

Perché cercare e sostituire il testo nei file PDF?

  • Garantire Privacy e Conformità: Rimuovi facilmente dati personali o riservati prima di pubblicare o condividere file PDF.

  • Aggiorna documenti in modo efficiente: sostituisci automaticamente termini o contenuti obsoleti in grandi lotti di file.

  • Opzioni di ricerca testuale flessibile: Utilizza sia il corrispondenza esatta delle frasi che le espressioni regolari per una redazione completa.

  • Preservare l’integrità del documento: Mantenere il layout e il formato originali sostituendo il contenuto.

  • Automation Friendly: Integra nelle procedure Java per l’elaborazione batch e i compiti di automazione dei documenti.

Trova e sostituisci testo in PDF utilizzando Java - Installazione SDK

Per redigere documenti PDF, è necessario configurare Conholdate.Total for Java SDK nel proprio ambiente. È possibile scaricare il file DLL dalla sezione Nuove Versioni o utilizzare il comando di installazione NuGet qui sotto in Visual Studio:

Install-Package Conholdate.Total

Trova e sostituisci testo in PDF utilizzando Java

Quando si tratta di documenti PDF che contengono informazioni sensibili come nomi, dettagli di contatto o identificatori di organizzazione, spesso è necessario ridurre o sostituire queste parole prima di condividere il file. Conholdate.Total per Java SDK fornisce un modo semplice per raggiungere questo obiettivo. Il seguente esempio dimostra come cercare un corrispondenza esatta di una parola o frase e sostituirla con un segnaposto o un testo alternativo.

final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);

In questo frammento, l’SDK esamina il file PDF per la frase "John Doe" e sostituisce ogni istanza con il termine "[censored]". Questa operazione è particolarmente utile nell’automazione della rimozione di informazioni personali identificabili dai documenti. L’opzione AddSuffix assicura che il file originale rimanga intatto salvando la versione modificata come un nuovo file, mentre il flag RasterizeToPDF mantiene l’output come un PDF basato su testo piuttosto che convertirlo in un’immagine.

Trova e sostituisci testo in PDF con espressioni regolari in Java

A volte, il testo che deve essere sostituito in un PDF non segue un formato fisso. Ad esempio, modelli come numeri di fattura, codici postali o numeri di identificazione possono variare da documento a documento. In tali situazioni, le espressioni regolari offrono una soluzione dinamica. Il Conholdate.Total per Java SDK consente agli sviluppatori di definire modelli regex per rilevare e sostituire strutture di testo complesse all’interno di un PDF.

// Find text using regular expression and replace it with some other text using Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();

L’espressione regolare utilizzata in questo codice corrisponde a un modello comunemente usato per codici formattati, come riferimenti bancari o identificatori di transazione. Qualsiasi testo che si adatta a questo modello viene automaticamente individuato e sostituito con un’etichetta predefinita come "[censored]". Questo livello di flessibilità garantisce che tu possa proteggere informazioni sensibili anche quando non conosci il loro contenuto esatto in anticipo.

Conclusione

Trovare e sostituire testo in documenti PDF utilizzando Java non è mai stato così facile, grazie alle capacità offerte da Conholdate.Total per Java. Che tu stia sostituendo una specifica parola o cercando modelli variabili con espressioni regolari, questo SDK garantisce che tu possa manipolare il contenuto del tuo PDF con precisione e controllo. La possibilità di oscurare informazioni sensibili, automatizzare aggiornamenti e preservare la formattazione del documento rende questo uno strumento potente per gli sviluppatori in tutti i settori. Integralo nei tuoi progetti Java oggi e semplifica i tuoi flussi di lavoro di elaborazione dei documenti con fiducia.

Vedi anche