Het programmatig aanpassen van PDF-inhoud kan cruciaal zijn in scenario’s waarbij gevoelige of verouderde informatie moet worden vervangen voordat deze wordt verspreid. Een van de meest praktische functies in PDF-manipulatie is de mogelijkheid om te zoeken naar een specifieke zin of patroon en deze te vervangen door alternatieve inhoud. In deze gedetailleerde gids zullen we demonstreren hoe je tekst in PDF-bestanden kunt vinden en vervangen met behulp van Java. De focus zal liggen op het gebruik van de krachtige Conholdate.Total for Java SDK, die ontwikkelaars in staat stelt om robuuste documenten manipulatietaken uit te voeren, waaronder schrappen en vervangen met slechts een paar regels code.

We zullen twee belangrijke scenarios behandelen. De eerste zal uitleggen hoe je een exact woord of een zin in een PDF kunt vinden en vervangen. De tweede zal door het gebruik van reguliere expressies leiden om variabele patronen zoals telefoonnummers, rekeningnummers of andere aangepaste gegevensindelingen te matchen en te vervangen.

Waarom tekst vinden en vervangen in PDF-bestanden?

  • Zorg voor privacy en naleving: Verwijder eenvoudig persoonlijke of vertrouwelijke gegevens voordat je PDF-bestanden publiceert of deelt.

  • Update documenten efficiënt: Vervang automatisch verouderde termen of inhoud in grote batches bestanden.

  • Flexibele tekstzoekopties: Maak gebruik van zowel exacte zinsmatching als reguliere expressies voor uitgebreide redacties.

  • Preserve Document Integrity: Maintain the original layout and formatting while replacing the content.

  • Automatisering Vriendelijk: Integreer in Java-werkstromen voor batchverwerking en documentautomatiseringstaken.

Zoek en vervang tekst in PDF met Java - SDK-installatie

Om PDF-documenten te redigeren, moet je Conholdate.Total for Java SDK in je omgeving configureren. Je kunt de DLL-bestand downloaden vanuit de sectie Nieuwe Versies of de NuGet-installatieopdracht hieronder in Visual Studio gebruiken:

Install-Package Conholdate.Total

Vind en vervang tekst in PDF met Java

Wanneer u omgaat met PDF-documenten die gevoelige informatie bevatten, zoals namen, contactgegevens of organisatie-identificatoren, is er vaak behoefte om deze woorden te redigeren of te vervangen voordat u het bestand deelt. Conholdate.Total voor Java SDK biedt een eenvoudige manier om dit te bereiken. Het volgende voorbeeld laat zien hoe u kunt zoeken naar een exacte overeenkomst van een woord of zin en deze kunt vervangen door een placeholder of alternatieve tekst.

final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// If you want to save the redacted file at different location with diferent name.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);

In dit fragment scant de SDK het PDF-bestand op de zin “John Doe” en vervangt elke instantie door de term “[censored]”. Deze bewerking is vooral nuttig voor het automatiseren van het verwijderen van persoonsgebonden informatie uit documenten. De AddSuffix-optie zorgt ervoor dat het originele bestand onaangeroerd blijft door de bewerkte versie als een nieuw bestand op te slaan, terwijl de RasterizeToPDF-vlag de uitvoer als een tekstgebaseerd PDF houdt in plaats van het om te zetten in een afbeelding.

Zoek en vervang tekst in PDF met reguliere expressies in Java

Soms volgt tekst die in een PDF moet worden vervangen geen vast formaat. Patronen zoals factuurnummers, postcodes of identificatienummers kunnen van document tot document variëren. In dergelijke situaties bieden reguliere expressies een dynamische oplossing. De Conholdate.Total voor Java SDK stelt ontwikkelaars in staat om regex-patronen te definiëren om complexe tekststructuren binnen een PDF te detecteren en te vervangen.

// Find text using regular expression and replace it with some other text using Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();

De reguliere expressie die in deze code wordt gebruikt, matcht een patroon dat vaak wordt gebruikt voor opgemaakte codes, zoals bankreferenties of transactie-identificatoren. Elke tekst die past bij dit patroon wordt automatisch gevonden en vervangen door een vooraf gedefinieerd label zoals “[censored]”. Dit niveau van flexibiliteit zorgt ervoor dat je gevoelige informatie kunt beschermen, zelfs als je de exacte inhoud vooraf niet kent.

Conclusie

Het vinden en vervangen van tekst in PDF-documenten met Java is nog nooit zo eenvoudig geweest, dankzij de mogelijkheden die Conholdate.Total voor Java biedt. Of u nu een specifiek woord vervangt of op zoek bent naar variabele patronen met reguliere expressies, deze SDK zorgt ervoor dat u uw PDF-inhoud met precisie en controle kunt manipuleren. De mogelijkheid om gevoelige informatie te redigeren, updates te automatiseren en de documentindeling te behouden, maakt dit een krachtige tool voor ontwikkelaars in verschillende sectoren. Integreer het vandaag nog in uw Java-projecten en stroomlijn uw documentverwerkingswerkstromen met vertrouwen.

Zie ook