Преобразование PDF в Excel

Вы можете легко программно экспортировать табличные данные из файлов PDF в листы Excel (.xlsx или .xls) в приложении .NET. Такое преобразование полезно, когда вам нужно отредактировать данные или нужно применить различные расчеты, доступные в Excel. В этой статье вы узнаете, как конвертировать PDF в Excel с помощью C#.

В этой статье должны быть раскрыты следующие темы:

C# API для преобразования PDF в Excel

Я буду использовать GroupDocs.Conversion for .NET API для преобразования PDF в XLSX. Этот API обеспечивает быстрое, эффективное и надежное решение для преобразования файлов в приложения .NET без установки какого-либо внешнего программного обеспечения. Он также позволяет создавать мощные приложения для преобразования документов на C#, ASP.NET и других технологиях, связанных с .NET.

Вы можете либо скачать DLL API, либо установить его с помощью NuGet.

Install-Package GroupDocs.Conversion

Преобразование PDF в Excel с помощью C#

Вы можете конвертировать PDF-документы в Excel, выполнив простые шаги, указанные ниже:

  1. Установите PdfLoadOptions, если применимо.
  2. Задайте параметры преобразования с помощью SpreadsheetConvertOptions.
  3. Создайте экземпляр класса Converter.
  4. Укажите путь к файлу и параметры загрузки
  5. Вызовите метод Convert вместе с путем к выходному файлу и параметрами преобразования.

В следующем примере кода показано, как экспортировать табличные данные из файла PDF в лист Excel с помощью C#.

// Параметры загрузки PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Параметры преобразования Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Конвертировать PDF в XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Конвертировать PDF в XLSX

Конвертировать PDF в XLSX

Класс PdfLoadOptions предоставляет различные параметры для загрузки PDF-документов. Эти свойства включают FlattenAllFields, HidePdfAnnotations, Password и RemoveEmbeddedFiles. Более подробную информацию вы можете найти в документации.

Класс SpreadsheetConvertOptions предоставляет определенные свойства для преобразования файлов из других форматов в формат электронных таблиц.

  • Свойство PageNumber определяет начальный номер страницы исходного документа для преобразования.
  • Свойство PagesCount определяет общее количество страниц, которые необходимо преобразовать, начиная с PageNumber.
  • Вы можете преобразовать определенные страницы, предоставив список индексов страниц свойству Pages.
  • Вы можете установить пароль для преобразованного файла, используя свойство Password.
  • Свойство Zoom можно использовать для установки уровня масштабирования в процентах для преобразованного файла.
  • Свойство Format определяет выходной формат преобразованного файла.

Вы можете найти более подробную информацию о «преобразовании в электронную таблицу с дополнительными параметрами» в документации.

Получить бесплатную лицензию

Вы можете попробовать API без ограничений по ознакомительной версии, запросив бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как экспортировать табличные данные из документов PDF в листы Excel с помощью C#. Вы можете узнать больше о GroupDocs.Conversion .NET API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также