Javaを使用してPDFをHTMLに変換する

PDFは、ドキュメントのフォーマットを失うことなく、読み取り専用ドキュメントを共有および印刷することを提案します。 PDFドキュメントをHTMLWebページに簡単に変換し、任意のブラウザで表示できます。この記事では、Javaを使用してPDFドキュメントをHTMLWebページに変換する方法を学習します。

この記事では、次のトピックについて説明します。

PDFをHTMLに変換するJavaAPI—無料ダウンロード

PDFをHTMLに変換するには、GroupDocs.Conversion for JavaAPIを使用します。エンドユーザーに高速で効率的で信頼性の高いファイル変換ソリューションを提供します。 APIのJARをダウンロードするか、MavenベースのJavaアプリケーションに次のpom.xml構成を追加してください。

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Javaを使用したPDFからHTMLへの変換

以下に示す簡単な手順に従うことで、プログラムでPDFドキュメントをHTMLWebページに簡単に変換できます。

  1. まず、Converterクラスを使用してPDFドキュメントをロードします。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  3. 次に、オプションで、FixedLayout、FixedLayoutShowBordersなどのさまざまな変換オプションを設定します。
  4. 最後に、Converter.Convert()メソッドを使用してPDFをHTMLに変換します。出力ファイルのパスを取り、オプションを引数として変換します。

次のコードサンプルは、Javaを使用してPDFドキュメントをHTMLWebページに変換する方法を示しています。

// このコード例は、PDFドキュメントをHTMLファイルに変換する方法を示しています。
// 変換クラスオブジェクトを初期化します
変換er converter = new 変換er("C:\\Files\\Conversion\\sample.pdf");

// 変換オプションの定義
Markup変換Options options = new Markup変換Options();
options.setFixedLayout(true);

// 変換
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Javaを使用したPDFからHTMLへの変換

Javaを使用したPDFからHTMLへの変換。

ページ範囲をPDFからHTMLに変換

以下の手順に従って、PDFドキュメントのさまざまなページをHTMLに変換できます。

  1. まず、Converterクラスを使用してPDFドキュメントをロードします。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  3. 次に、変換を開始するページ番号を設定します。
  4. その後、総ページ数を変換するようにページ数を設定します。
  5. 最後に、Converter.Convert()メソッドを使用してPDFをHTMLに変換します。

次のコードサンプルは、Javaを使用してページの範囲をPDFドキュメントからHTMLファイルに変換する方法を示しています。

// このコード例は、PDFページの範囲をHTMLファイルに変換する方法を示しています。
// 変換クラスオブジェクトを初期化します
変換er converter = new 変換er("C:\\Files\\Conversion\\sample.pdf");

// 変換オプションの定義
Markup変換Options options = new Markup変換Options();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// 変換
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

PDFの特定のページをHTMLに変換する

以下の手順に従って、PDFドキュメントの特定のページをHTMLに変換できます。

  1. まず、Converterクラスを使用してPDFドキュメントをロードします。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  3. 次に、変換する特定のページ番号をカンマ区切りのリストに入力します。
  4. 最後に、Converter.Convert()メソッドを使用してPDFをHTMLに変換します。

次のコードサンプルは、Javaを使用してPDFドキュメントの特定のページをHTMLファイルに変換する方法を示しています。

// このコード例は、PDFドキュメントの特定のページをHTMLファイルに変換する方法を示しています。
// 変換クラスオブジェクトを初期化します
変換er converter = new 変換er("C:\\Files\\Conversion\\sample.pdf");

// 変換オプションの定義
Markup変換Options options = new Markup変換Options();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// 変換
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

パスワードで保護されたPDFをJavaでHTMLに変換する

以下の手順に従って、パスワードで保護されたPDFドキュメントをHTMLWebページに変換することもできます。

  1. まず、PdfLoadOptionsクラスオブジェクトを使用してパスワードを入力します。
  2. 次に、PdfLoadOptionsでConverterクラスを使用してPDFドキュメントをロードします。
  3. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  4. 最後に、Converter.Convert()メソッドを使用してPDFをHTMLに変換します。

次のコードサンプルは、Javaを使用してパスワードで保護されたPDFドキュメントをHTMLドキュメントに変換する方法を示しています。

// このコード例は、パスワードで保護されたPDFをHTMLに変換する方法を示しています。
// ロードオプションを定義する
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// 変換クラスオブジェクトを初期化します
変換er converter = new 変換er("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// 変換オプションの定義
Markup変換Options options = new Markup変換Options();

// 変換
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Javaで透かしを使用したPDFからHTMLへの変換

以下の手順に従って、PDFドキュメントをHTML Webページに変換し、変換されたHTMLファイルに透かしを追加できます。

  1. まず、Converterクラスを使用してPDFドキュメントをロードします。
  2. 次に、WatermarkOptionsクラスのインスタンスを作成します。
  3. 次に、テキスト、色、幅、高さ、フォントなどのさまざまなオプションを設定します。
  4. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  5. その後、WatermarkOptionsをMarkupConvertOptionsに割り当てます。
  6. 最後に、Converter.Convert()メソッドを使用してPDFをHTMLに変換します。

次のコードサンプルは、PDFドキュメントを透かし付きのHTMLドキュメントに変換する方法を示しています。

// このコード例は、透かしを使用してPDFをHTMLに変換する方法を示しています。
// 変換クラスオブジェクトを初期化します
変換er converter = new 変換er("C:\\Files\\Conversion\\sample.pdf");

// 透かしを定義する 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// 変換オプションの定義
Markup変換Options options = new Markup変換Options();
options.setWatermark(watermark);

// 出力ファイルパス
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// 変換
converter.convert(outputFile, options);
Javaで透かしを使用したPDFからHTMLへの変換

Javaで透かしを使用したPDFからHTMLへの変換。

無料ライセンスを取得する

無料の一時ライセンスをリクエストして、評価制限なしでAPIを試してください。

結論

この記事では、JavaでPDFドキュメントをHTMLWebページに変換する方法を学びました。また、パスワードで保護されたPDFファイルをHTMLに変換し、変換されたファイルにプログラムで透かしを追加する方法も確認しました。さらに、ドキュメントを使用して、JavaAPIのGroupDocs.Conversionについて詳しく知ることができます。ご不明な点がございましたら、フォーラムまでお気軽にお問い合わせください。

関連項目