
Вы можете легко программно экспортировать табличные данные из файлов PDF в листы Excel (.xlsx или .xls) в приложении .NET. Такое преобразование полезно, когда вам нужно отредактировать данные или нужно применить различные расчеты, доступные в Excel. В этой статье вы узнаете, как конвертировать PDF в Excel с помощью C#.
В этой статье должны быть раскрыты следующие темы:
C# API для преобразования PDF в Excel
Я буду использовать GroupDocs.Conversion for .NET API для преобразования PDF в XLSX. Этот API обеспечивает быстрое, эффективное и надежное решение для преобразования файлов в приложения .NET без установки какого-либо внешнего программного обеспечения. Он также позволяет создавать мощные приложения для преобразования документов на C#, ASP.NET и других технологиях, связанных с .NET.
Вы можете либо скачать DLL API, либо установить его с помощью NuGet.
Install-Package GroupDocs.Conversion
Преобразование PDF в Excel с помощью C#
Вы можете конвертировать PDF-документы в Excel, выполнив простые шаги, указанные ниже:
- Установите PdfLoadOptions, если применимо.
- Задайте параметры преобразования с помощью SpreadsheetConvertOptions.
- Создайте экземпляр класса Converter.
- Укажите путь к файлу и параметры загрузки
- Вызовите метод Convert вместе с путем к выходному файлу и параметрами преобразования.
В следующем примере кода показано, как экспортировать табличные данные из файла PDF в лист Excel с помощью C#.
// Параметры загрузки PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
FlattenAllFields = true, // all fields in the source document will be flatten during conversion
Password = "123" // provide password if document is password protected
};
// Параметры преобразования Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 1, // Starting page number
PagesCount = 1, // Total pages to convert
Format = SpreadsheetFileType.Xlsx, // Conversion format
Password = "password", // Set password for converted file
Zoom = 110 // Zoom level
};
// Конвертировать PDF в XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);

Конвертировать PDF в XLSX
Класс PdfLoadOptions предоставляет различные параметры для загрузки PDF-документов. Эти свойства включают FlattenAllFields, HidePdfAnnotations, Password и RemoveEmbeddedFiles. Более подробную информацию вы можете найти в документации.
Класс SpreadsheetConvertOptions предоставляет определенные свойства для преобразования файлов из других форматов в формат электронных таблиц.
- Свойство PageNumber определяет начальный номер страницы исходного документа для преобразования.
- Свойство PagesCount определяет общее количество страниц, которые необходимо преобразовать, начиная с PageNumber.
- Вы можете преобразовать определенные страницы, предоставив список индексов страниц свойству Pages.
- Вы можете установить пароль для преобразованного файла, используя свойство Password.
- Свойство Zoom можно использовать для установки уровня масштабирования в процентах для преобразованного файла.
- Свойство Format определяет выходной формат преобразованного файла.
Вы можете найти более подробную информацию о «преобразовании в электронную таблицу с дополнительными параметрами» в документации.
Получить бесплатную лицензию
Вы можете попробовать API без ограничений по ознакомительной версии, запросив бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как экспортировать табличные данные из документов PDF в листы Excel с помощью C#. Вы можете узнать больше о GroupDocs.Conversion .NET API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.