Convert PDF to Word using Java

JavaアプリケーションでプログラムによってPDFドキュメントをWordドキュメント(.docxまたは.doc)に簡単に変換できます。このような変換は、PDFドキュメントのテキストを編集する必要がある場合、またはテキスト形式を適用する必要がある場合に役立ちます。この記事では、Javaを使用してPDFをWordに変換する方法を学習します。

この記事では、次のトピックについて説明/取り上げています。

PDFをWordに変換するJavaAPI

PDFからDOCXへの変換には、GroupDocs.Conversion for JavaAPIを使用します。このAPIは、外部ソフトウェアをインストールすることなく、Javaアプリケーションへの高速で効率的かつ信頼性の高いファイル変換ソリューションを提供します。 PDF、HTML、Eメール、Word、Excel、PowerPoint, Project、Photoshop、CorelDraw、AutoCAD、ラスター画像ファイル形式など、一般的なすべてのビジネスドキュメント形式間の変換をサポートしています。また、ドキュメント全体を表示したり、部分的にレンダリングしてプロセスを高速化したりすることもできます。 APIはすべてのJavaバージョンと互換性があり、Javaランタイムを実行できる一般的なオペレーティングシステム(Windows、Linux、macOS)をサポートします。

ダウンロードして構成する

APIのJARをダウンロードするか、MavenベースのJavaアプリケーションに次のpom.xml構成を追加して、以下のコード例を試すことができます。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Javaを使用してPDFをWordに変換する

以下の簡単な手順に従って、PDFドキュメントをWordに変換できます。

  1. Converterクラスのインスタンスを作成します
  2. 入力ファイルのパスを指定します
  3. WordProcessingConvertOptionsのインスタンスを作成します
  4. スタートページ番号を設定する
  5. 変換する合計ページを提供する
  6. 出力ファイル形式を設定する
  7. Convert()メソッドを、出力ファイルのパスと変換オプションとともに呼び出します

次のコードサンプルは、Javaを使用してPDFファイルをWord文書に変換する方法を示しています。

// コンバーターを作成する
Converter 変換er = new Converter("C:\\Files\\sample.pdf");

// Word変換オプションを設定する
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// 変換
変換er.変換("C:\\Files\\output.docx", options);
Javaを使用してPDFをWordに変換する

Javaを使用してPDFをWordに変換する

Converterクラスは、ドキュメント変換プロセスを制御するメインクラスです。サポートされているファイル形式のドキュメントを変換するためのさまざまな方法を提供します。このクラスのConvert()メソッドは、ソースドキュメントを変換し、ソースドキュメントへのファイルパスとConvertOptionsの2つの入力パラメーターを使用して、特定のソースドキュメントを目的のターゲットファイルタイプに変換します。

WordProcessingConvertOptionsクラスは、WordProcessingファイルタイプに変換するためのオプションを提供します。 setPageNumber()メソッドを使用すると、変換を開始するための開始ページ番号を設定できます。一方、setPagesCount()メソッドは、定義されたページ番号から開始して変換されるページの総数を定義します。このクラスのsetFormat()メソッドを使用すると、変換されたドキュメントの出力形式を設定できます。 WordProcessingFileType列挙型を入力として受け取ります。

PDFの特定のページをWordに変換する

以下に示す簡単な手順に従って、PDFドキュメントの特定のページをWordに変換できます。

  1. Converterクラスのインスタンスを作成します
  2. 入力ファイルのパスを指定します
  3. WordProcessingConvertOptionsのインスタンスを作成します
  4. 変換するページ番号リストを設定する
  5. Convert()メソッドを、出力ファイルのパスと変換オプションとともに呼び出します

次のコードサンプルは、Javaを使用して特定のページをPDFファイルからWord文書に変換する方法を示しています。

// コンバーターを作成する
Converter 変換er = new Converter("C:\\Files\\sample.pdf");

// Word変換オプションを定義する
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// 変換
変換er.変換("C:\\Files\\output.docx", options);

WordProcessingConvertOptionsクラスは、コンマ区切りのリストで定義された特定のページ番号をソースドキュメントから変換するためのsetPages()メソッドを提供します。

パスワードで保護されたPDFをロードしてWordに変換

以下の簡単な手順に従って、パスワードで保護されたPDFドキュメントをWordに変換できます。

  1. PdfLoadOptionsを作成します
  2. パスワードを設定してください
  3. Converterクラスのインスタンスを作成します
  4. 入力ファイルのパスを指定します
  5. WordProcessingConvertOptionsのインスタンスを作成します
  6. Convert()メソッドを、出力ファイルのパスと変換オプションとともに呼び出します

次のコードサンプルは、Javaを使用してパスワードで保護されたPDFファイルをWord文書に変換する方法を示しています。

// PDFロードオプション
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// コンバーターを作成する
Converter 変換er = new Converter("C:\\Files\\sample.pdf", loadOptions);

// Word変換オプションを定義する
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// 変換
変換er.変換("C:\\Files\\output.docx", options);

PdfLoadOptionsクラスは、PDFドキュメントをロードするためのさまざまなオプションを提供します。このクラスのsetPassword()メソッドを使用すると、パスワードを指定して保護されたドキュメントの保護を解除できます。

オプション付きのPDFドキュメントのロード」の詳細については、ドキュメントを参照してください。

無料ライセンスを取得する

無料の一時ライセンスをリクエストすることで、評価の制限なしにAPIを試すことができます。

結論

この記事では、Javaを使用してPDFドキュメントをWordに変換する方法を学びました。また、パスワードで保護されたPDFファイルをWord文書に変換する方法も学びました。さらに、プログラムで特定のページをPDFからWord文書に変換する方法を学びました。 ドキュメントを使用して、GroupDocs.ConversionJavaAPIについてさらに詳しく知ることができます。ご不明な点がございましたら、フォーラムまでお気軽にお問い合わせください。

関連項目