Convertir PDF en Excel

Vous pouvez facilement exporter des données tabulaires à partir de fichiers PDF vers des feuilles Excel (.xlsx ou .xls) par programmation dans votre application .NET. Une telle conversion est utile lorsque vous devez modifier des données ou appliquer divers calculs disponibles dans Excel. Dans cet article, vous allez apprendre comment convertir un PDF en Excel en utilisant C#. Les sujets suivants seront traités dans cet article:

API C# pour convertir un PDF en Excel

J’utiliserai GroupDocs.Conversion pour l’API .NET pour la conversion de PDF en XLSX. Cette API fournit une solution de conversion de fichiers rapide, efficace et fiable en applications .NET sans installer de logiciel externe. Il vous permet également de créer de puissantes applications de conversion de documents en C#, ASP.NET et d’autres technologies liées à .NET. Vous pouvez soit télécharger la DLL de l’API, soit l’installer à l’aide de NuGet.

Install-Package GroupDocs.Conversion

Convertir un PDF en Excel à l’aide de C#

Vous pouvez convertir des documents PDF en Excel en suivant les étapes simples ci-dessous:

  1. Définissez PdfLoadOptions le cas échéant.
  2. Définissez les options de conversion à l’aide de SpreadsheetConvertOptions
  3. Créez une instance de la classe Converter
  4. Indiquez le chemin du fichier et les options de chargement
  5. Appelez la méthode Convert avec le chemin du fichier de sortie et les options de conversion

L’exemple de code suivant montre comment exporter des données tabulaires d’un fichier PDF vers une feuille Excel à l’aide de C#.

// Options de chargement PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Options de conversion Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Convertir PDF en XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Convertir PDF en XLSX

Convertir PDF en XLSX

La classe PdfLoadOptions fournit diverses options pour charger des documents PDF. Ces propriétés incluent FlattenAllFields, HidePdfAnnotations, Password et RemoveEmbeddedFiles. Vous pouvez trouver plus de détails dans la documentation. La classe SpreadsheetConvertOptions fournit certaines propriétés pour convertir des fichiers d’autres formats en type de fichier Feuille de calcul.

  • La propriété PageNumber définit le numéro de page de départ du document source à convertir.
  • La propriété PagesCount définit le nombre total de pages à convertir à partir de PageNumber.
  • Vous pouvez convertir des pages spécifiques en fournissant une liste d’index de page à la propriété Pages.
  • Vous pouvez définir un mot de passe pour le fichier converti à l’aide de la propriété Password.
  • La propriété Zoom peut être utilisée pour définir le niveau de zoom en pourcentage pour le fichier converti.
  • La propriété Format définit le format de sortie du fichier converti.

Vous pouvez trouver plus de détails sur “convertir en une feuille de calcul avec des options avancées” dans la documentation.

Obtenez une licence gratuite

Vous pouvez essayer l’API sans limitation d’évaluation en demandant une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez appris comment exporter des données de tableau de documents PDF vers des feuilles Excel à l’aide de C#. Vous pouvez en savoir plus sur l’API GroupDocs.Conversion .NET en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également