Java を使用して Word を Markdown に変換する

Java を使用して Word を Markdown に変換する

Markdown 言語は豊富な機能スタックを提供し、習得が容易です。一方、MS Word ドキュメントは、ビジネス データを適切に管理された方法で整理および表現する上で、常にプラスでした。しかし、急速なアプリケーション開発では、実行時に変更を加えることが非常に重要です。したがって、Markdown ファイルは、ビジネス アプリの開発に関しては非常に役立ちます。このブログ投稿では、プログラムで Java を使用して Word を Markdown に変換する方法を紹介します。

次のセクションについて説明します。

Java Docx ライブラリのインストール

これは、豊富な機能を備えた ライブラリ であり、Java アプリケーション用のエンタープライズ レベルの Word から Markdown へのコンバーターを構築できます。ただし、API を ダウンロード することも、Maven ベースの Java アプリケーションに次の構成を追加することもできます。

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Java を使用して Word を Markdown に変換する

実際、この Java Docx ライブラリには、Word 文書を他の一般的なファイルおよび画像形式にプログラムで変換するためのメソッドが多数公開されています。

以下の手順とコード スニペットに従ってください。

  1. Document クラスのコンストラクターを初期化して、ソース Word ドキュメントを読み込みます。
  2. save メソッドを呼び出して、ドキュメントを Markdown 形式で保存します。

次のコードをコピーしてメイン ファイルに貼り付けます。

// Document クラスのコンストラクターを初期化して、ソース Word ドキュメントを読み込みます。 
Document doc = new Document("sample.doc");
// save メソッドを呼び出して、ドキュメントを Markdown 形式で保存します。 
doc.save(  "SaveDocx2Markdown.md");

以下の画像で出力を確認できます。

Word から Markdown へのコンバーター

Word から Markdown へのコンバーター - 高度なオプション

この Java ライブラリのその他の優れた機能を確認してみましょう。そのため、いくつかのスタイルを使用してドキュメントを作成し、Markdown に保存します。

手順は次のとおりです。

  1. Document クラスのオブジェクトを作成します。
  2. DocumentBuilder クラスのインスタンスをインスタンス化して、ドキュメントへのコンテンツの追加をスムーズにします。
  3. insertParagraph メソッドを呼び出して、段落の「見出し 1」スタイルを指定します。
  4. setStyleName メソッドを呼び出して、この書式設定に適用される段落スタイルの名前を設定します。
  5. write メソッドを呼び出して、ドキュメントの現在の挿入位置に文字列を挿入します。
  6. setItalic メソッドを呼び出して、フォント形式を斜体にします。
  7. insertHyperlink メソッドを呼び出して、ドキュメントにハイパーリンクを挿入します。
  8. save メソッドを呼び出して、ドキュメントを Markdown ファイルとして保存します。
// Document クラスのオブジェクトを作成します。 
Document doc = new Document();
// ドキュメントへのコンテンツの追加をスムーズにするために、DocumentBuilder クラスのインスタンスをインスタンス化します。
DocumentBuilder builder = new DocumentBuilder(doc);
// insertParagraph メソッドを呼び出して、段落の「見出し 1」スタイルを指定します。 
builder.insertParagraph();
// setStyleName メソッドを呼び出して、この書式設定に適用される段落スタイルの名前を設定します。 
builder.getParagraphFormat().setStyleName("Heading 1");
// write メソッドを呼び出して、ドキュメントの現在の挿入位置に文字列を挿入します。 
builder.write("Heading 1");
// 段落の斜体強調を指定します。
builder.insertParagraph();
// 前の段落のスタイルをリセットして、段落間でスタイルを結合しないようにします。
builder.getParagraphFormat().setStyleName("Normal");
// setItalic メソッドを呼び出して、フォント形式を斜体にします。 
builder.getFont().setItalic(true);
builder.write("Italic Text");
// 前の段落のスタイルをリセットして、段落間でスタイルを結合しないようにします。
builder.setItalic(false);
// 目的のテキストのハイパーリンクを指定します。
builder.insertParagraph();
// ドキュメントにハイパーリンクを挿入するには、insertHyperlink メソッドを呼び出します。 
builder.insertHyperlink("Aspose","https://www.aspose.com", false);
builder.write("Aspose");
// save メソッドを呼び出して、ドキュメントを Markdown ファイルとして保存します。
doc.save(  "example.md");

出力は以下の画像に示されています。

ワードからMDへ

無料ライセンスを取得する

無料の一時ライセンス を利用して、評価制限なしで API を試すことができます。

まとめ

プログラムで Java を使用して Word を Markdown に変換する方法を学習したことを願って、このチュートリアルをここで終了できます。さらに、この Java Docx ライブラリーが提供するいくつかの高度な方法についても説明しました。また、このライブラリの ドキュメント にアクセスせずに立ち去らないでください。

さらに、Getting Started guide に従うことをお勧めします。

最後に、conholdate.com が新しいブログ記事を書いています。したがって、定期的な更新については、連絡を取り合ってください。

質問する

フォーラムでご質問やご質問をお知らせください。

よくある質問

.NET アプリケーションで HTML ドキュメントを作成するにはどうすればよいですか?

Document クラスのコンストラクターを初期化して、ソース Word ドキュメントを読み込みます。次に、save メソッドを呼び出して、ドキュメントを Markdown 形式で保存します。

関連項目