Javaを使用してHTMLをWordに変換する

Javaを使用してHTMLをWordに変換する

このブログ投稿では、プログラムでJavaを使用してHTMLWordに変換する方法を説明します。幸い、このJavaライブラリは、ファイルの即時処理、操作、および変換を提供します。このライブラリは、外部の依存関係なしに簡単にインストールできます。さらに、そのインストールと使用法に関して利用可能な包括的なドキュメントがあります。 Microsoft Word文書は、現在最も広く使用されているファイル形式です。したがって、HTMLからWordへの変換プロセスを段階的に説明します。

以下の点について説明します。

Javaを使用してHTMLをWordに変換する-APIのインストール

このJavaDOCXライブラリは、ファイル変換プロセスを強化する機能の膨大なスタックを提供します。これにより、データとファイルの操作タスクを制御できます。 Javaアプリケーションでこのライブラリを有効にするには、jarファイルをダウンロードするか、次のMaven構成に従うことができます。

リポジトリ

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

依存

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

プログラムでWebページをWordに変換する方法

HTMLページをプログラムでWord文書に変換するのはとても簡単です。この機能は、以下に説明するいくつかの手順に従って実行できます。

  1. Documentクラスのインスタンスを作成し、ソースHTMLファイルをロードします。
  2. save(java.lang.String fileName、int saveFormat)メソッドを呼び出して、ファイルをDOCX形式で保存します。

次のコードをコピーしてJavaファイルに貼り付け、HTMLファイルをWordファイルに変換します。

// Documentクラスのインスタンスを作成し、ソースHTMLファイルをロードします
Document document = new Document("index.html");
// save(java.lang.String fileName、int saveFormat)メソッドを呼び出して、ファイルをDOCX形式で保存します
document.save("output.docx", SaveFormat.DOCX);

HTMLからWordへのコンバータライブラリ-高度な機能

このセクションでは、ドキュメントの品質の設定、パスワードの設定などの高度な機能について説明します。

次の手順とコードスニペットを実行して、その他の方法について知ることができます。

  1. Documentクラスのインスタンスを作成し、ソースHTMLファイルをロードします。
  2. protect(int type、java.lang.String password)メソッドを使用すると、ドキュメントを変更から保護するためのパスワードを設定できます。
  3. unprotect()はパスワードを削除します。
  4. このsetTrackRevisionsメソッドを設定します。このドキュメントがMicrosoftWordで編集されたときに変更が追跡される場合は、Trueになります。
  5. setShowSpellingErrorsメソッドがTrueの場合、スペルミスが強調表示されます。
  6. setShowGrammaticalErrorsメソッドは、Trueの場合に文法エラーを強調表示します。
  7. removeAllChildrenは、現在のノードのすべての子ノードを削除します。
  8. DocSaveOptionsクラスのインスタンスをインスタンス化します。
  9. setUseHighQualityRenderingメソッドを呼び出して、高品質(つまり低速)のレンダリングアルゴリズムを使用するかどうかを決定する値を設定します。
  10. save(java.lang.String fileName、int saveFormat)メソッドを呼び出して、ファイルをDOCX形式で保存します。
        // Documentクラスのインスタンスを作成し、ソースHTMLファイルをロードします
        Document document = new Document("index.html");
        // secure(int type、java.lang.String password)メソッドを使用すると、ドキュメントを変更から保護するためのパスワードを設定できます。
        document.protect(1,"password");
        // unprotect()はパスワードを削除します
        document.unprotect();
        // このsetTrackRevisionsメソッドを設定します。このドキュメントがMicrosoftWordで編集されたときに変更が追跡される場合は、Trueになります。
        document.setTrackRevisions(true);
        // setShowSpellingErrorsメソッドがTrueの場合、スペルミスが強調表示されます
        document.setShowSpellingErrors(true);
        // setShowGrammaticalErrorsメソッドは、Trueの場合に文法エラーを強調表示します
        document.setShowGrammaticalErrors(true);
        // removeAllChildrenは、現在のノードのすべての子ノードを削除します。
        document.removeAllChildren();
        // DocSaveOptionsクラスのインスタンスをインスタンス化します
        DocSaveOptions opt = new DocSaveOptions();
        // setUseHighQualityRenderingメソッドを呼び出して、高品質(つまり低速)のレンダリングアルゴリズムを使用するかどうかを決定する値を設定します。
        opt.setUseHighQualityRendering(true);
        // save(java.lang.String fileName、int saveFormat)メソッドを呼び出して、ファイルをDOCX形式で保存します
        document.save("output.docx", SaveFormat.DOCX);

無料ライセンスを取得する

無料の一時ライセンスを取得して、評価の制限なしにAPIを試すことができます。

まとめ

これで、このブログ投稿は終わりです。プログラムでJavaを使用してHTMLをWordに変換する方法について説明しました。さらに、上記のセクションで説明した機能のコードスニペットを見つけることができます。さらに、HTMLからWordへのコンバーターに役立つその他の機能については、ドキュメントにアクセスしてください。最後に、conholdate.comは他のトピックに関する新しいブログ投稿を書いています。したがって、定期的な更新については連絡を取り合ってください。

質問する

あなたは私たちのフォーラムであなたの質問や質問を共有することができます。

関連項目