Word での検索と置換

今日のブログ投稿では、Java を使用して Word (DOC/DOCX) ドキュメント内のテキストを検索および置換する方法を説明します。 Java Word テキスト編集 API の操作、単語や語句の検索と置換、大文字と小文字を区別した検索、高度な置換のための正規表現 (RegEx) を使用したテキストの置換など、このタスクのさまざまな側面を取り上げます。

この記事では次の点について説明します。

Java Word テキスト墨消しライブラリ - インストール

まず、Conholdate.Total for Java ライブラリをセットアップする必要があります。この Java ライブラリのインストール手順は非常に簡単です。 Maven ユーザーは、pom.xml ファイルに次の構成を追加するだけで済みます。

<repository>
	<id>ConholdateJavaAPI</id>
	<name>Conholdate Java API</name>
	<url>https://releases.conholdate.com/java/repo</url>
</repository>        
<dependency>
	<groupId>com.conholdate</groupId>
	<artifactId>conholdate-total</artifactId>
	<version>23.6</version>
	<type>pom</type>
</dependency>

次に、次のコマンドを実行します。

mvn clean    
mvn install -U

他の Java フレームワークを設定するには、releases.conholdate.com にアクセスしてください。

無料ライセンスを取得する

無料の一時ライセンス をダウンロードして、評価制限なしでライブラリをテストできます。

### 質問する Java PDF ページ削除ライブラリに関する質問やコメントは、この フォーラム に投稿できます。

Java Word テキスト墨消しライブラリの使用

テキストの編集を MS Word に依存する煩わしさはもう不要です。 Java を使用すると、すべてを自分たちで処理できるため、外部ソフトウェアは必要ありません。 Java を使用して Word 文書内のテキストを検索および置換するためのさまざまなアプローチを検討します。 Java の機能を活用して、効率的な検索および置換操作を実行します。この多用途なプログラミング言語を使用して、プログラムでテキストの変更をいかに簡単に処理できるかに驚かれるでしょう。

次のスクリーンショットに示すように、サンプル Word ドキュメントを使用します。

PDF から 1 ページを削除

単語またはフレーズの検索と置換: Java プログラムの作成手順

以下は、Word 文書内の単語/フレーズのインスタンスを検索して置換する方法を説明する手順です。

  1. まず、Redactorクラスを使用してDOC/DOCXファイルをロードします。
  2. 次に、ExactPhraseRedaction クラスと ReplacementOptions クラスを使用して、ターゲットのフレーズまたは単語を検索します。
  3. 次に、Redactor の apply メソッドを使用してリダクションを適用します。
  4. その後、出力ストリームを使用して、変更したファイルを別の場所に保存します。
  5. 最後に、save メソッドを使用して編集の変更を保存します。

次の Java コードは、上記の Word 文書内で単語「John Doe」を検索し、「John Doe」のすべてのインスタンスを単語「[検閲]」に置き換えます。

コードの出力は次のとおりです。

単語の検索と置換

大文字と小文字を区別するテキストの検索と置換

単語の大文字と小文字の正確な一致が重要であると思われるため、大文字と小文字を区別する検索に関連する単語のみに置き換えたいと考えています。次のコードは、Java 内の単語「John Doe」の大文字と小文字が完全に一致する箇所を置き換えます。 コードの出力は次のとおりです。

大文字と小文字を区別するテキストの検索と置換

Java の正規表現 (RegEx) を使用した検索と置換

特定の単語ではなく文書内のパターンを更新したい場合。以下の手順に従って、Java プログラムで正規表現 (RegEx) を使用して、テキストの任意のパターンを検索および置換できます。

  1. Redactor クラスを使用してドキュメントをロードします。
  2. RegexRedactionを使用して RegEx パターンを作成します。
  3. ReplacementOptionsで置換テキストを指定します。
  4. apply メソッドを使用してリダクションを適用します。
  5. save メソッドを使用して編集した文書を保存します。

次の Java コードは、RegEx を使用して MS Word 文書内で単語検索を実行し、それを他のテキストに置き換える方法を示しています。 コードの出力は次のとおりです。

正規表現の検索と置換

結論

このブログ投稿を読み終えるまでに、Java と Conholdate.Total for Java ライブラリを使用して Word 文書内のテキストを検索および置換する方法を包括的に理解できるようになります。このタスクを効率的に自動化し、生産性を向上させ、文書操作のワークフローを簡素化するための知識とツールを身につけることができます。それでは、Conholdate.Total for Java の機能を活用して、Java ベースの Word 文書処理を改善しましょう。

最後に、conholdate.com に定期的にアクセスして最新情報を入手してください。

関連項目