Znajdź i zamień w programie Word

W dzisiejszym wpisie na blogu omówimy, jak znaleźć i zastąpić tekst w dokumentach programu Word (DOC/DOCX) przy użyciu języka Java. Omówimy różne aspekty tego zadania, w tym pracę z interfejsem API redagowania tekstu Java Word, znajdowanie i zastępowanie słów lub fraz, wyszukiwanie z uwzględnieniem wielkości liter, a nawet zastępowanie tekstu przy użyciu wyrażeń regularnych (RegEx) w celu zaawansowanego zastępowania.

W tym artykule zostaną omówione następujące punkty:

Biblioteka redakcji tekstu Java Word — instalacja

Na początek musimy skonfigurować bibliotekę Conholdate.Total for Java. Procedura instalacji tej biblioteki Java jest bardzo prosta. Użytkownicy Mavena mogą po prostu dodać następujące konfiguracje w pliku pom.xml.

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

Następnie uruchom następujące polecenia.

mvn clean    
mvn install -U

Aby skonfigurować inne frameworki Java, odwiedź stronę releases.conholdate.com.

Zdobądź bezpłatną licencję

Możesz pobrać bezpłatną licencję tymczasową, aby przetestować bibliotekę bez ograniczeń ewaluacyjnych.

Zadać pytanie

Na tym forum możesz zamieszczać swoje pytania i komentarze dotyczące biblioteki narzędzia do usuwania stron Java PDF.

Korzystanie z biblioteki redakcji tekstu Java Word

Pożegnaj kłopoty związane z redagowaniem tekstu w programie MS Word. Dzięki Javie poradzimy sobie ze wszystkim sami, nie jest potrzebne żadne zewnętrzne oprogramowanie. Przeanalizujemy różne podejścia do wyszukiwania i zastępowania tekstu w dokumentach programu Word przy użyciu języka Java. Wykorzystamy możliwości języka Java do wykonywania wydajnych operacji wyszukiwania i zamiany. Będziesz zaskoczony, jak łatwo możesz programowo obsługiwać modyfikacje tekstu, używając tego wszechstronnego języka programowania.

Będziemy używać przykładowego dokumentu programu Word, jak pokazano na poniższym zrzucie ekranu:

Usuń jedną stronę z pliku PDF

Wyszukaj i zamień słowa lub frazy: kroki pisania programu w języku Java

Poniżej przedstawiono kroki wyjaśniające, jak znaleźć, a następnie zastąpić dowolne wystąpienia słowa/frazy w dokumencie programu Word.

  1. Najpierw załaduj plik DOC/DOCX przy użyciu klasy Redactor.
  2. Następnie znajdź docelową frazę lub słowo, korzystając z klas ExactPhraseRedaction i ReplacementOptions.
  3. Następnie zastosuj redakcję za pomocą metody zastosuj Redaktora.
  4. Następnie zapisz zmodyfikowany plik w innej lokalizacji, korzystając ze strumienia wyjściowego.
  5. Na koniec zapisz zmiany redakcyjne za pomocą metody save.

Poniższy kod Java znajduje słowo „John Doe" w powyższym dokumencie programu Word i zastępuje wszystkie wystąpienia „John Doe" słowem „[cenzura]".

// Znajdź dokładną frazę i zastąp ją innym tekstem za pomocą języka Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", new ReplacementOptions("[censored]")));
// Jeśli chcesz zapisać zredagowany plik w innej lokalizacji i pod inną nazwą.
FileOutputStream stream = new FileOutputStream("path/exactPhrase.docx");
RasterizationOptions rasterOptions = new RasterizationOptions();
rasterOptions.setEnabled(false);
redactor.save(stream, rasterOptions);

Dane wyjściowe kodu są następujące.

Wyszukaj i zamień słowo

Znajdź i zamień tekst uwzględniający wielkość liter

Dokładna wielkość liter w słowie wydaje się być dla Ciebie ważna i chcesz ją zastąpić tylko słowami, które odpowiadają Twojemu wyszukiwaniu z uwzględnieniem wielkości liter. Poniższy kod zastępuje wystąpienia dokładnego dopasowania wielkości liter słowa „John Doe" w Javie.

// Znajdź dokładną frazę (wielkość liter ma znaczenie) i zastąp ją innym tekstem za pomocą języka Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new ExactPhraseRedaction("John Doe", true /*isCaseSensitive*/, new ReplacementOptions("[censored]")));
redactor.save();

Dane wyjściowe kodu są następujące.

Znajdź i zamień tekst uwzględniający wielkość liter

Znajdź i zamień za pomocą wyrażeń regularnych (RegEx) w Javie

Jeśli chcesz zaktualizować wzór w dokumencie, a nie konkretne słowo. Możesz używać wyrażeń regularnych (RegEx) w programach Java, aby znaleźć i zastąpić dowolny wzorzec tekstu, wykonując poniższe kroki.

  1. Załaduj dokument z klasą Redactor.
  2. Utwórz wzorzec RegEx za pomocą RegexRedaction.
  3. Określ tekst zastępczy za pomocą opcji ReplacementOptions.
  4. Zastosuj redakcję za pomocą metody zastosuj.
  5. Zapisz zredagowany dokument, korzystając z metody zapisz.

Poniższy kod Java pokazuje, jak przeprowadzić wyszukiwanie słów w dokumencie MS Word przy użyciu wyrażenia RegEx i zastąpić je innym tekstem.

// Znajdź tekst za pomocą wyrażenia regularnego i zamień go na inny tekst za pomocą języka Java
final Redactor redactor  = new Redactor("path/document.docx");
redactor.apply(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions("[censored]")));
redactor.save();

Dane wyjściowe kodu są następujące.

wyrażenie regularne znajdź i zamień

Wniosek

Pod koniec tego wpisu na blogu będziesz mieć pełną wiedzę na temat wyszukiwania i zastępowania tekstu w dokumentach programu Word przy użyciu języka Java, korzystając z biblioteki Conholdate.Total for Java. Będziesz wyposażony w wiedzę i narzędzia umożliwiające skuteczną automatyzację tego zadania, zwiększając produktywność i upraszczając przepływ pracy z dokumentami. Zacznijmy więc korzystać z możliwości Conholdate.Total dla języka Java, aby usprawnić przetwarzanie dokumentów programu Word w oparciu o język Java!

Na koniec odwiedzaj stronę conholdate.com, aby otrzymywać regularne aktualizacje.

Zobacz też