Você pode exportar facilmente dados tabulares de arquivos PDF para planilhas do Excel (.xlsx ou .xls) programaticamente em seu aplicativo .NET. Essa conversão é útil quando você precisa editar dados ou aplicar vários cálculos disponíveis no Excel. Neste artigo, você aprenderá como converter PDF para Excel usando C#.
Os seguintes tópicos serão abordados neste artigo:
API C# para converter PDF para Excel
Eu estarei usando GroupDocs.Conversion for .NET API para a conversão de PDF para XLSX. Essa API fornece uma solução de conversão de arquivos rápida, eficiente e confiável em aplicativos .NET sem instalar nenhum software externo. Ele também permite que você crie aplicativos de conversão de documentos poderosos em C#, ASP.NET e outras tecnologias relacionadas ao .NET.
Você pode baixar a DLL da API ou instalá-la usando NuGet.
Install-Package GroupDocs.Conversion
Converter PDF para Excel usando C#
Você pode converter documentos PDF para Excel seguindo as etapas simples abaixo:
- Defina PdfLoadOptions se aplicável.
- Defina as opções de conversão usando SpreadsheetConvertOptions
- Crie uma instância da classe Converter
- Forneça o caminho do arquivo e as opções de carregamento
- Chame o método Convert junto com o caminho do arquivo de saída e as opções de conversão
O exemplo de código a seguir mostra como exportar dados tabulares de um arquivo PDF para uma planilha do Excel usando C#.
// Opções de carregamento de PDF
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
FlattenAllFields = true, // all fields in the source document will be flatten during conversion
Password = "123" // provide password if document is password protected
};
// Opções de conversão do Excel
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
PageNumber = 1, // Starting page number
PagesCount = 1, // Total pages to convert
Format = SpreadsheetFileType.Xlsx, // Conversion format
Password = "password", // Set password for converted file
Zoom = 110 // Zoom level
};
// Converter PDF para XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
A classe PdfLoadOptions fornece várias opções para carregar documentos PDF. Essas propriedades incluem FlattenAllFields, HidePdfAnnotations, Password e RemoveEmbeddedFiles. Você pode encontrar mais detalhes na documentação.
A classe SpreadsheetConvertOptions fornece certas propriedades para converter arquivos de outros formatos para o tipo de arquivo Planilha.
- A propriedade PageNumber define o número da página inicial do documento de origem a ser convertido.
- A propriedade PagesCount define o número total de páginas a serem convertidas a partir de PageNumber.
- Você pode converter páginas específicas fornecendo uma lista de índices de página para a propriedade Pages.
- Você pode definir uma senha para o arquivo convertido usando a propriedade Password.
- A propriedade Zoom pode ser usada para definir o nível de zoom em porcentagem para o arquivo convertido.
- A propriedade Format define o formato de saída do arquivo convertido.
Você pode encontrar mais detalhes sobre “converter em uma planilha com opções avançadas” na documentação.
Obtenha uma licença gratuita
Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu como exportar dados de tabela de documentos PDF para planilhas do Excel usando C#. Você pode aprender ainda mais sobre GroupDocs.Conversion .NET API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.