Zoeken en vervangen in Word

In de blogpost van vandaag onderzoeken we hoe we tekst in Word-documenten (DOC/DOCX) kunnen vinden en vervangen met Java. We behandelen verschillende aspecten van deze taak, waaronder het werken met de Java Word-API voor tekstredactie, het zoeken en vervangen van woorden of woordgroepen, hoofdlettergevoelige zoekopdrachten en zelfs het vervangen van tekst met behulp van reguliere expressies (RegEx) voor geavanceerde vervangingen.

In dit artikel komen de volgende punten aan bod:

Java Word-bibliotheek voor tekstredactie - Installatie

Om te beginnen moeten we de bibliotheek Conholdate.Total for Java instellen. De installatieprocedure van deze Java-bibliotheek is heel eenvoudig. De Maven-gebruikers kunnen eenvoudig de volgende configuraties toevoegen in het pom.xml-bestand.

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

Voer vervolgens de volgende opdrachten uit.

mvn clean    
mvn install -U

Ga naar releases.conholdate.com om andere Java-frameworks te configureren.

Vraag een gratis licentie aan

U kunt een gratis tijdelijke licentie downloaden om de bibliotheek te testen zonder evaluatiebeperkingen.

Een vraag stellen

U kunt uw vragen of opmerkingen over de Java PDF-bibliotheek voor het verwijderen van pagina’s op dit forum posten.

De Java Word-bibliotheek voor tekstredactie gebruiken

Zeg vaarwel tegen het gedoe van het vertrouwen op MS Word voor tekstredactie. Met Java kunnen we het allemaal zelf aan, er is geen externe software nodig. We zullen verschillende benaderingen verkennen om het zoeken en vervangen van tekst in Word-documenten met Java aan te pakken. We maken gebruik van de kracht van Java om efficiënte zoek- en vervangbewerkingen uit te voeren. U zult versteld staan hoe gemakkelijk u tekstwijzigingen programmatisch kunt verwerken met deze veelzijdige programmeertaal.

We zullen het voorbeeld Word-document gebruiken zoals weergegeven in de volgende schermafbeelding:

Verwijder een pagina uit pdf

Zoek en vervang woorden of zinnen: stappen om een Java-programma te schrijven

Hieronder volgen de stappen die uitleggen hoe u instanties van een woord/zin in een Word-document kunt vinden en vervangen.

  1. Laad eerst het DOC/DOCX-bestand met de klasse Redactor.
  2. Zoek vervolgens de doelzin of het doelwoord met de klassen ExactPhraseRedaction en ReplacementOptions.
  3. Pas vervolgens de redactie toe met behulp van de methode toepassen van Redactor.
  4. Sla daarna het gewijzigde bestand op een andere locatie op met behulp van de uitvoerstroom.
  5. Sla ten slotte de redactiewijzigingen op met de methode opslaan.

De volgende Java-code vindt het woord “John Doe” in het bovenstaande Word-document en vervangt alle instanties van “John Doe” door het woord “[gecensureerd]”.

De uitvoer van de code is als volgt.

Zoek en vervang woord

Zoek en vervang hoofdlettergevoelige tekst {#zoek en vervang hoofdlettergevoelig woord}

De exacte hoofdletter van het woord lijkt belangrijk voor u te zijn en u wilt deze alleen vervangen door woorden die relevant zijn voor uw hoofdlettergevoelige zoekopdracht. De volgende code vervangt de exemplaren van de exacte hoofdletterovereenkomst van het woord “John Doe” in Java. De uitvoer van de code is als volgt.

Zoek en vervang hoofdlettergevoelige tekst

Zoeken en vervangen met reguliere expressies (RegEx) in Java

Als u een patroon in uw document wilt bijwerken in plaats van een specifiek woord. U kunt reguliere expressies (RegEx) in Java-programma’s gebruiken om elk tekstpatroon te zoeken en te vervangen door de onderstaande stappen te volgen.

  1. Laad het document met de klasse Redactor.
  2. Maak een RegEx-patroon met RegexRedaction.
  3. Specificeer de vervangende tekst met ReplacementOptions.
  4. Pas de redactie toe met de methode toepassen.
  5. Sla het geredigeerde document op met de methode opslaan.

De volgende Java-code laat zien hoe u de woordzoeker in een MS Word-document uitvoert met behulp van RegEx en deze vervangt door een andere tekst. De uitvoer van de code is als volgt.

regex zoeken en vervangen

Conclusie

Aan het einde van deze blogpost heb je een uitgebreid begrip van hoe je tekst in Word-documenten kunt vinden en vervangen met behulp van Java met de Conholdate.Total for Java-bibliotheek. U wordt uitgerust met de kennis en hulpmiddelen om deze taak efficiënt te automatiseren, de productiviteit te verbeteren en workflows voor documentmanipulatie te vereenvoudigen. Dus laten we aan de slag gaan en gebruikmaken van de kracht van Conholdate.Total voor Java om uw op Java gebaseerde Word-documentverwerking te verbeteren!

Blijf ten slotte conholdate.com bezoeken voor regelmatige updates.

Zie ook