Sie können tabellarische Daten aus PDF-Dateien ganz einfach programmgesteuert in Ihre .NET-Anwendung in Excel-Tabellen (.xlsx oder .xls) exportieren. Eine solche Konvertierung ist nützlich, wenn Sie Daten bearbeiten oder verschiedene in Excel verfügbare Berechnungen anwenden müssen. In diesem Artikel erfahren Sie, wie Sie mit C# PDF in Excel konvertieren.
Folgende Themen sollen in diesem Artikel behandelt werden:
C#-API zum Konvertieren von PDF in Excel
Ich werde GroupDocs.Conversion for .NET API für die Konvertierung von PDF in XLSX verwenden. Diese API bietet eine schnelle, effiziente und zuverlässige Dateikonvertierungslösung in .NET-Anwendungen, ohne dass externe Software installiert werden muss. Außerdem können Sie damit leistungsstarke Anwendungen zur Dokumentenkonvertierung in C#, ASP.NET und anderen .NET-bezogenen Technologien erstellen.
Sie können die DLL der API entweder herunterladen oder mit NuGet installieren.
Install-Package GroupDocs.Conversion
Konvertieren Sie PDF in Excel mit C#
Sie können PDF-Dokumente in Excel konvertieren, indem Sie die folgenden einfachen Schritte ausführen:
- Legen Sie gegebenenfalls PdfLoadOptions fest.
- Konvertierungsoptionen mit SpreadsheetConvertOptions festlegen
- Erstellen Sie eine Instanz der Klasse Converter.
- Geben Sie den Dateipfad und die Ladeoptionen an
- Rufen Sie die Methode Convert zusammen mit dem Ausgabedateipfad und den Konvertierungsoptionen auf
Das folgende Codebeispiel zeigt, wie tabellarische Daten mit C# aus einer PDF-Datei in ein Excel-Arbeitsblatt exportiert werden.
// PDF-Ladeoptionen
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
FlattenAllFields = true, // all fields in the source document will be flatten during conversion
Password = "123" // provide password if document is password protected
};
// Excel-Konvertierungsoptionen
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 1, // Starting page number
PagesCount = 1, // Total pages to convert
Format = SpreadsheetFileType.Xlsx, // Conversion format
Password = "password", // Set password for converted file
Zoom = 110 // Zoom level
};
// Konvertieren Sie PDF in XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Die PdfLoadOptions-Klasse bietet verschiedene Optionen zum Laden von PDF-Dokumenten. Diese Eigenschaften umfassen FlattenAllFields, HidePdfAnnotations, Password und RemoveEmbeddedFiles. Weitere Details finden Sie in der Dokumentation.
Die Klasse SpreadsheetConvertOptions stellt bestimmte Eigenschaften zum Konvertieren von Dateien aus anderen Formaten in den Dateityp Spreadsheet bereit.
- Die Eigenschaft PageNumber definiert die Anfangsseitenzahl des zu konvertierenden Quelldokuments.
- Die Eigenschaft PagesCount definiert die Gesamtzahl der zu konvertierenden Seiten beginnend mit PageNumber.
- Sie können bestimmte Seiten konvertieren, indem Sie eine Liste von Seitenindizes für die Pages-Eigenschaft bereitstellen.
- Mit der Eigenschaft Password können Sie ein Passwort für die konvertierte Datei festlegen.
- Die Zoom-Eigenschaft kann verwendet werden, um die Zoomstufe in Prozent für die konvertierte Datei festzulegen.
- Die Eigenschaft Format definiert das Ausgabeformat der konvertierten Datei.
Weitere Einzelheiten zu „Konvertieren in eine Tabelle mit erweiterten Optionen“ finden Sie in der Dokumentation.
Holen Sie sich eine kostenlose Lizenz
Sie können die API ohne Evaluierungseinschränkungen testen, indem Sie eine kostenlose temporäre Lizenz anfordern.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie mit C# Tabellendaten aus PDF-Dokumenten in Excel-Tabellen exportieren. Sie können noch mehr über GroupDocs.Conversion .NET API erfahren, indem Sie die Dokumentation verwenden. Bei Unklarheiten können Sie sich gerne im Forum an uns wenden.