Converter PDF para Excel

Você pode exportar facilmente dados tabulares de arquivos PDF para planilhas do Excel (.xlsx ou .xls) programaticamente em seu aplicativo .NET. Essa conversão é útil quando você precisa editar dados ou aplicar vários cálculos disponíveis no Excel. Neste artigo, você aprenderá como converter PDF para Excel usando C#.

Os seguintes tópicos serão abordados neste artigo:

API C# para converter PDF para Excel

Eu estarei usando GroupDocs.Conversion for .NET API para a conversão de PDF para XLSX. Essa API fornece uma solução de conversão de arquivos rápida, eficiente e confiável em aplicativos .NET sem instalar nenhum software externo. Ele também permite que você crie aplicativos de conversão de documentos poderosos em C#, ASP.NET e outras tecnologias relacionadas ao .NET.

Você pode baixar a DLL da API ou instalá-la usando NuGet.

Install-Package GroupDocs.Conversion

Converter PDF para Excel usando C#

Você pode converter documentos PDF para Excel seguindo as etapas simples abaixo:

  1. Defina PdfLoadOptions se aplicável.
  2. Defina as opções de conversão usando SpreadsheetConvertOptions
  3. Crie uma instância da classe Converter
  4. Forneça o caminho do arquivo e as opções de carregamento
  5. Chame o método Convert junto com o caminho do arquivo de saída e as opções de conversão

O exemplo de código a seguir mostra como exportar dados tabulares de um arquivo PDF para uma planilha do Excel usando C#.

// Opções de carregamento de PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Opções de conversão do Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// Converter PDF para XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
Converter PDF para XLSX

Converter PDF para XLSX

A classe PdfLoadOptions fornece várias opções para carregar documentos PDF. Essas propriedades incluem FlattenAllFields, HidePdfAnnotations, Password e RemoveEmbeddedFiles. Você pode encontrar mais detalhes na documentação.

A classe SpreadsheetConvertOptions fornece certas propriedades para converter arquivos de outros formatos para o tipo de arquivo Planilha.

  • A propriedade PageNumber define o número da página inicial do documento de origem a ser convertido.
  • A propriedade PagesCount define o número total de páginas a serem convertidas a partir de PageNumber.
  • Você pode converter páginas específicas fornecendo uma lista de índices de página para a propriedade Pages.
  • Você pode definir uma senha para o arquivo convertido usando a propriedade Password.
  • A propriedade Zoom pode ser usada para definir o nível de zoom em porcentagem para o arquivo convertido.
  • A propriedade Format define o formato de saída do arquivo convertido.

Você pode encontrar mais detalhes sobre “converter em uma planilha com opções avançadas” na documentação.

Obtenha uma licença gratuita

Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como exportar dados de tabela de documentos PDF para planilhas do Excel usando C#. Você pode aprender ainda mais sobre GroupDocs.Conversion .NET API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.

Veja também