Java で Word を HTML に変換する

Java で Word を HTML に変換する

このブログ投稿は、ビジネス アプリケーション用の Word から HTML へのコンバーターを開発する場合に役立ちます。この Java Word ライブラリ をインストールして、Docx ファイルを HTMLPNGPDF などの他の一般的な形式に変換できます。ただし、このチュートリアルの終わりまでに、このファイル変換 Java ライブラリーについて十分な知識が必要です。したがって、記事を開始して、プログラムで Java で Word を HTML に変換する方法を学びましょう。

以下の点について説明します。

Java Word ライブラリのインストール

このライブラリのインストール プロセスは、開発とインストールに関する包括的なドキュメントがあるため、開発者にとって非常に使いやすいものです。そのため、JAR ファイルを ダウンロード するか、次の Maven 構成を使用してこのライブラリをインストールできます。

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Java で Word を HTML に変換する

Java アプリケーションでソース コードを記述して、Word から HTML へのコンバーターをプログラムで作成する準備が整いました。

Word を HTML に変換する手順は次のとおりです。

  1. Document クラスのインスタンスを作成し、ソース Word ファイルを読み込みます。
  2. HtmlSaveOptions クラスのオブジェクトを初期化して、ドキュメントを HTML 形式で保存するときに追加のオプションを指定します。
  3. setExportRoundtripInformationを呼び出して、HTML保存時に往復情報を書き込むかどうかを指定します。
  4. setExportFontResources メソッドの値が true の場合、フォント リソースは HTML にエクスポートされます。
  5. setExportFontsAsBase64 メソッドを呼び出して、フォント リソースを Base64 エンコーディングで HTML に埋め込むかどうかを指定します。
  6. save メソッドは、Word 文書を HTML 形式で保存します。

次のコードをコピーしてメイン ファイルに貼り付けます。

// Document クラスのインスタンスを作成し、ソースの Word ファイルを読み込みます。 
Document doc = new Document(  "sample.doc");
// HtmlSaveOptions クラスのオブジェクトを初期化して、ドキュメントを HTML 形式で保存するときに追加のオプションを指定します。  
HtmlSaveOptions options = new HtmlSaveOptions();
// setExportRoundtripInformation を呼び出して、HTML に保存するときにラウンドトリップ情報を書き込むかどうかを指定します。
options.setExportRoundtripInformation(true);
// setExportFontResources メソッドの値が true の場合、フォント リソースは HTML にエクスポートされます。
options.setExportFontResources(true);
// setExportFontsAsBase64 メソッドを呼び出して、フォント リソースを Base64 エンコーディングで HTML に埋め込むかどうかを指定します。
options.setExportFontsAsBase64(true);
// ここで、save メソッドは Word 文書を HTML 形式で保存します。  
doc.save("Document_out.html", SaveFormat.HTML);

出力は次の画像で確認できます。

単語からhtmlへ

無料ライセンスを取得する

無料の一時ライセンス を利用して、評価制限なしで API を試すことができます。

まとめ

ここでこのブログ投稿を終了できます。うまくいけば、この記事を楽しんで、Word を Java の HTML にプログラムで変換する方法を学んだことでしょう。この Java Word ライブラリには他にも多くの機能が公開されているため、ドキュメント にアクセスすることを忘れないでください。

さらに、Getting Started guide に従うことをお勧めします。

最後に、conholdate.com が新しいブログ記事を書いています。そのため、定期的な更新については連絡を取り合ってください。

質問する

フォーラムで質問やクエリをお知らせください。

よくある質問

DOCX を HTML に変換するにはどうすればよいですか?

Document クラスのインスタンスを作成してソース Word ファイルを読み込み、save メソッドを呼び出して Word ファイルを HTML 形式で保存します。

関連項目