Konwertuj PDF na Excel

Możesz łatwo eksportować dane tabelaryczne z plików PDF do arkuszy Excel (.xlsx lub .xls) programowo w aplikacji .NET. Taka konwersja jest przydatna w przypadku konieczności edycji danych lub konieczności zastosowania różnych obliczeń dostępnych w programie Excel. W tym artykule dowiesz się, jak przekonwertować plik PDF na format Excel przy użyciu języka C#.

W tym artykule zostaną omówione następujące tematy:

API C# do konwersji plików PDF do Excela

Będę używać GroupDocs.Conversion for .NET API do konwersji PDF na XLSX. Ten interfejs API zapewnia szybkie, wydajne i niezawodne rozwiązanie do konwersji plików do aplikacji .NET bez konieczności instalowania zewnętrznego oprogramowania. Umożliwia także tworzenie wydajnych aplikacji do konwersji dokumentów w językach C#, ASP.NET i innych technologiach powiązanych z platformą .NET.

Możesz pobrać bibliotekę DLL interfejsu API lub zainstalować ją za pomocą NuGet.

Install-Package GroupDocs.Conversion

Konwertuj plik PDF na Excel za pomocą C#

Możesz konwertować dokumenty PDF do formatu Excel, wykonując proste kroki podane poniżej:

  1. Ustaw PdfLoadOptions, jeśli ma to zastosowanie.
  2. Ustaw opcje konwersji za pomocą SpreadsheetConvertOptions
  3. Utwórz instancję klasy Converter.
  4. Podaj ścieżkę pliku i opcje ładowania
  5. Wywołaj metodę Convert wraz ze ścieżką do pliku wyjściowego i opcjami konwersji

Poniższy przykładowy kod pokazuje, jak eksportować dane tabelaryczne z pliku PDF do arkusza programu Excel przy użyciu języka C#.

// Opcje ładowania PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Opcje konwersji programu Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Konwertuj PDF na XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Konwertuj PDF na XLSX

Konwertuj PDF na XLSX

Klasa PdfLoadOptions udostępnia różne opcje ładowania dokumentów PDF. Te właściwości obejmują FlattenAllFields, HidePdfAnnotations, Password i RemoveEmbeddedFiles. Więcej szczegółów możesz znaleźć w dokumentacji.

Klasa SpreadsheetConvertOptions udostępnia pewne właściwości umożliwiające konwersję plików z innych formatów na typ pliku arkusza kalkulacyjnego.

  • Właściwość PageNumber definiuje numer strony początkowej dokumentu źródłowego do konwersji.
  • Właściwość PagesCount definiuje całkowitą liczbę stron do konwersji, zaczynając od PageNumber.
  • Możesz konwertować określone strony, dostarczając listę indeksów stron do właściwości Pages.
  • Możesz ustawić hasło dla przekonwertowanego pliku za pomocą właściwości Hasło.
  • Właściwość Zoom umożliwia ustawienie procentowego stopnia powiększenia konwertowanego pliku.
  • Właściwość Format definiuje format wyjściowy przekonwertowanego pliku.

Więcej szczegółów na temat „[konwersji na arkusz kalkulacyjny z opcjami zaawansowanymi]" znajdziesz w dokumentacji.

Zdobądź bezpłatną licencję

Możesz wypróbować interfejs API bez ograniczeń ewaluacyjnych, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule dowiedziałeś się, jak eksportować dane tabeli z dokumentów PDF do arkuszy Excel przy użyciu języka C#. Możesz dowiedzieć się jeszcze więcej o API GroupDocs.Conversion .NET korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też