
您可以在 .NET 应用程序中以编程方式轻松地将表格数据从 PDF 文件导出到 Excel 工作表(.xlsx 或 .xls)。当您需要编辑数据或需要应用 Excel 中可用的各种计算时,这种转换很有用。在本文中,您将学习如何使用 C# 将 PDF 转换为 Excel。
本文将涵盖以下主题:
C# API 将 PDF 转换为 Excel
我将使用 GroupDocs.Conversion for .NET API 将 PDF 转换为 XLSX。该 API 提供了一种快速、高效、可靠的文件转换解决方案到 .NET 应用程序中,而无需安装任何外部软件。它还使您能够使用 C#、ASP.NET 和其他 .NET 相关技术构建功能强大的文档转换应用程序。
您可以下载 API 的 DLL 或使用 NuGet 安装它。
Install-Package GroupDocs.Conversion
使用 C# 将 PDF 转换为 Excel
您可以按照以下简单步骤将 PDF 文档转换为 Excel:
- 如果适用,请设置 PdfLoadOptions。
- 使用 SpreadsheetConvertOptions 设置转换选项
- 创建 Converter 类的实例
- 提供文件路径和加载选项
- 调用 Convert 方法以及输出文件路径和转换选项
以下代码示例演示如何使用 C# 将表格数据从 PDF 文件导出到 Excel 工作表。
// PDF 加载选项
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
FlattenAllFields = true, // all fields in the source document will be flatten during conversion
Password = "123" // provide password if document is password protected
};
// Excel 转换选项
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 1, // Starting page number
PagesCount = 1, // Total pages to convert
Format = SpreadsheetFileType.Xlsx, // Conversion format
Password = "password", // Set password for converted file
Zoom = 110 // Zoom level
};
// 将 PDF 转换为 XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);

将 PDF 转换为 XLSX
PdfLoadOptions 类提供加载 PDF 文档的各种选项。这些 properties 包括 FlattenAllFields、HidePdfAnnotations、Password 和 RemoveEmbeddedFiles。您可以在 文档 中找到更多详细信息。
SpreadsheetConvertOptions 类提供了某些 properties 用于将文件从其他格式转换为电子表格文件类型。
- PageNumber 属性定义要转换的源文档的起始页码。
- PagesCount 属性定义要从 PageNumber 开始转换的总页数。
- 您可以通过向 Pages 属性提供页面索引列表来转换特定页面。
- 您可以使用 Password 属性为转换后的文件设置密码。
- Zoom 属性可用于设置转换文件的百分比缩放级别。
- Format 属性定义转换文件的输出格式。
您可以在文档中找到有关“使用高级选项转换为电子表格”的更多详细信息。
获得免费许可证
您可以通过请求 免费的临时许可证 来试用该 API,而不受评估限制。
结论
在本文中,您学习了如何使用 C# 将表格数据从 PDF 文档导出到 Excel 工作表。您可以使用 文档 了解有关 GroupDocs.Conversion .NET API 的更多信息。如有任何歧义,请随时在 论坛 上与我们联系。