Convertir PDF a Excel

Puede exportar fácilmente datos tabulares de archivos PDF a hojas de Excel (.xlsx o .xls) mediante programación en su aplicación .NET. Dicha conversión es útil cuando necesita editar datos o necesita aplicar varios cálculos disponibles en Excel. En este artículo, aprenderá cómo convertir PDF a Excel usando C#.

En este artículo se tratarán los siguientes temas:

API de C# para convertir PDF a Excel

Usaré GroupDocs.Conversion for .NET API para la conversión de PDF a XLSX. Esta API proporciona una solución de conversión de archivos rápida, eficiente y confiable en aplicaciones .NET sin instalar ningún software externo. También le permite crear potentes aplicaciones de conversión de documentos en C#, ASP.NET y otras tecnologías relacionadas con .NET.

Puede descargar la DLL de la API o instalarla mediante NuGet.

Install-Package GroupDocs.Conversion

Convertir PDF a Excel usando C#

Puede convertir documentos PDF a Excel siguiendo los sencillos pasos que se indican a continuación:

  1. Establezca PdfLoadOptions si corresponde.
  2. Configure las opciones de conversión usando SpreadsheetConvertOptions
  3. Crear una instancia de la clase Convertidor
  4. Proporcione la ruta del archivo y las opciones de carga
  5. Llame al método Convertir junto con la ruta del archivo de salida y las opciones de conversión

El siguiente ejemplo de código muestra cómo exportar datos tabulares desde un archivo PDF a una hoja de Excel usando C#.

// Opciones de carga de PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Opciones de conversión de Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Convertir PDF a XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Convertir PDF a XLSX

Convertir PDF a XLSX

La clase PdfLoadOptions proporciona varias opciones para cargar documentos PDF. Estas propiedades incluyen FlattenAllFields, HidePdfAnnotations, Password y RemoveEmbeddedFiles. Puede encontrar más detalles en la documentación.

La clase SpreadsheetConvertOptions proporciona ciertas propiedades para convertir archivos de otros formatos al tipo de archivo de hoja de cálculo.

  • La propiedad PageNumber define el número de página inicial del documento de origen para convertir.
  • La propiedad PagesCount define el número total de páginas que se convertirán a partir de PageNumber.
  • Puede convertir páginas específicas proporcionando una lista de índices de página a la propiedad Páginas.
  • Puede establecer una contraseña para el archivo convertido mediante la propiedad Contraseña.
  • La propiedad Zoom se puede utilizar para establecer el nivel de zoom en porcentaje para el archivo convertido.
  • La propiedad Formato define el formato de salida del archivo convertido.

Puede encontrar más detalles sobre “convertir a una hoja de cálculo con opciones avanzadas” en la documentación.

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a exportar datos de tablas desde documentos PDF a hojas de Excel usando C#. Puede aprender aún más sobre GroupDocs.Conversion .NET API utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también