C#を使用してPDFをHTMLに変換する

PDFは、ドキュメントを共有および印刷するための最も一般的な形式です。場合によっては、PDFドキュメントをHTMLWebページに変換する必要があります。このような変換は、PDFドキュメントのコンテンツを共有するのに役立ち、関連する利害関係者がPDFドキュメントを任意のブラウザで簡単に表示できるようになります。この記事では、C#を使用してPDFドキュメントをHTMLWebページに変換する方法を学習します。

この記事では、次のトピックについて説明します。

PDFをHTMLに変換するC#API —無料ダウンロード

GroupDocs.Conversion for .NET APIを使用して、PDFをHTMLに変換します。エンドユーザーに高速で効率的で信頼性の高いファイル変換ソリューションを提供します。 APIのDLLをダウンロードするか、NuGetを使用してインストールしてください。

Install-Package GroupDocs.Conversion

C#を使用したPDFからHTMLへの変換

以下に示す簡単な手順に従うことで、プログラムでPDFドキュメントをHTMLWebページに簡単に変換できます。

  1. まず、入力ファイルのパスを引数としてConverterクラスを使用してPDFドキュメントをロードします。これは、ドキュメント変換プロセスを制御するメインクラスです。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。マークアップファイルタイプに変換するためのさまざまなオプションを提供します。
  3. 次に、オプションで、FixedLayout、FixedLayoutShowBordersなどのさまざまな変換オプションを設定します。
  4. 最後に、Converter.Convert()メソッドを呼び出して、変換されたHTMLファイルを保存します。このメソッドは、出力ファイルのパスを取り、オプションを引数として変換します。

次のコードサンプルは、C#を使用してPDFドキュメントをHTMLWebページに変換する方法を示しています。

// ソースPDFファイルをロードします
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// HTML形式の変換オプションを設定します
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// HTML形式に変換する
converter.Convert(@"C:\Files\Conversion\converted.html", options);
PDFをC#でHTMLに変換します。

PDFをC#でHTMLに変換します。

ページ範囲をPDFからHTMLに変換

以下の手順に従って、PDFドキュメントのさまざまなページをプログラムでHTMLに変換できます。

  1. まず、入力ファイルのパスを引数としてConverterクラスを使用してPDFドキュメントをロードします。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  3. 次に、変換を開始するページ番号を設定します
  4. その後、総ページ数を変換するようにページ数を設定します
  5. 最後に、出力ファイルパスと変換オプションを指定してConverter.Convert()メソッドを呼び出し、変換されたHTMLファイルを保存します。

次のコードサンプルは、C#でPDFドキュメントからHTMLファイルにページの範囲を変換する方法を示しています。

// ソースPDFファイルをロードします
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// HTML形式の変換オプションを設定します
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// HTML形式に変換する
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

PDFの特定のページをHTMLに変換する

以下の手順に従って、PDFドキュメントの特定のページをHTMLに変換できます。

  1. まず、入力ファイルのパスを引数としてConverterクラスを使用してPDFドキュメントをロードします。
  2. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  3. 次に、変換する特定のページ番号をカンマ区切りのリストに入力します。
  4. 最後に、出力ファイルパスと変換オプションを指定してConverter.Convert()メソッドを呼び出し、変換されたHTMLファイルを保存します。

次のコードサンプルは、PDFドキュメントの特定のページをC#でHTMLファイルに変換する方法を示しています。

// ソースPDFファイルをロードします
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// HTML形式の変換オプションを設定します
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// HTML形式に変換する
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

C#で透かしを使用したPDFからHTMLへの変換

以下の手順に従って、PDFドキュメントをHTML Webページに変換し、変換されたHTMLファイルに透かしをプログラムで追加できます。

  1. まず、入力ファイルのパスを引数としてConverterクラスを使用してPDFドキュメントをロードします。
  2. 次に、WatermarkOptionsクラスのインスタンスを作成します。
  3. 次に、テキスト、色、幅、高さ、フォントなどのさまざまなオプションを設定します。
  4. 次に、MarkupConvertOptionsクラスのインスタンスを作成します。
  5. その後、WatermarkOptionsをMarkupConvertOptionsに割り当てます。
  6. 最後に、出力ファイルパスと変換オプションを指定してConverter.Convert()メソッドを呼び出し、変換されたHTMLファイルを保存します。

次のコードサンプルは、PDFドキュメントを透かし付きのHTMLドキュメントに変換する方法を示しています。

// ソースPDFファイルをロードします
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// テキスト透かしを定義する
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// HTML形式の変換オプションを設定します
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// HTML形式に変換する
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
C#で透かしを使用したPDFからHTMLへの変換。

C#で透かしを使用したPDFからHTMLへの変換。

無料ライセンスを取得する

無料の一時ライセンスをリクエストして、評価制限なしでAPIを試してください。

結論

この記事では、C#でPDFドキュメントをHTMLWebページに変換する方法を学びました。また、PDFの特定のページをHTMLに変換し、プログラムで変換されたファイルに透かしを追加する方法も確認しました。さらに、ドキュメントを使用して、GroupDocs.Conversion for.NETAPIについて詳しく知ることができます。ご不明な点がございましたら、フォーラムまでお気軽にお問い合わせください。

関連項目