PDFをExcelに変換する

表形式のデータをPDFファイルから.NETアプリケーションのExcelシート(.xlsxまたは.xls)にプログラムで簡単にエクスポートできます。このような変換は、データを編集する必要がある場合、またはExcelで使用可能なさまざまな計算を適用する必要がある場合に役立ちます。この記事では、C#を使用してPDFをExcelに変換する方法を学習します。

この記事では、次のトピックについて説明します。

PDFをExcelに変換するC#API

PDFからXLSXへの変換には、GroupDocs.Conversion for .NETAPIを使用します。このAPIは、外部ソフトウェアをインストールすることなく、.NETアプリケーションへの高速で効率的かつ信頼性の高いファイル変換ソリューションを提供します。また、C#、ASP.NET、およびその他の.NET関連テクノロジで強力なドキュメント変換アプリケーションを構築することもできます。

APIのDLLをダウンロードするか、NuGetを使用してインストールできます。

Install-Package GroupDocs.Conversion

C#を使用してPDFをExcelに変換する

以下の簡単な手順に従って、PDFドキュメントをExcelに変換できます。

  1. 該当する場合は、PdfLoadOptionsを設定します。
  2. SpreadsheetConvertOptionsを使用して変換オプションを設定します
  3. Converterクラスのインスタンスを作成します
  4. ファイルパスとロードオプションを指定します
  5. Convertメソッドを、出力ファイルのパスと変換オプションとともに呼び出します

次のコードサンプルは、C#を使用してPDFファイルからExcelシートに表形式のデータをエクスポートする方法を示しています。

// PDFロードオプション
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Excelの変換オプション
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// PDFをXLSXに変換する
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
PDFをXLSXに変換する

PDFをXLSXに変換する

PdfLoadOptionsクラスは、PDFドキュメントをロードするためのさまざまなオプションを提供します。これらのプロパティには、FlattenAllFields、HidePdfAnnotations、Password、およびRemoveEmbeddedFilesが含まれます。詳細については、ドキュメントをご覧ください。

SpreadsheetConvertOptionsクラスは、ファイルを他の形式からSpreadsheetファイルタイプに変換するための特定のプロパティを提供します。

  • PageNumberプロパティは、変換するソースドキュメントの開始ページ番号を定義します。
  • PagesCountプロパティは、PageNumberから始まる変換されるページの総数を定義します。
  • ページインデックスのリストをPagesプロパティに提供することにより、特定のページを変換できます。
  • Passwordプロパティを使用して、変換されたファイルのパスワードを設定できます。
  • Zoomプロパティを使用して、変換されたファイルのズームレベルをパーセンテージで設定できます。
  • Formatプロパティは、変換されたファイルの出力形式を定義します。

高度なオプションを使用したスプレッドシートへの変換」の詳細については、ドキュメントをご覧ください。

無料ライセンスを取得する

無料の一時ライセンスをリクエストすることで、評価の制限なしにAPIを試すことができます。

結論

この記事では、C#を使用してPDFドキュメントからExcelシートにテーブルデータをエクスポートする方法を学習しました。 ドキュメントを使用して、GroupDocs.Conversion.NETAPIについてさらに詳しく知ることができます。ご不明な点がございましたら、フォーラムまでお気軽にお問い合わせください。

関連項目