PDF é o formato mais popular para compartilhamento e impressão de documentos. Em certos casos, podemos precisar converter documentos PDF em páginas da Web HTML. Essa conversão ajuda a compartilhar o conteúdo de documentos PDF para que as partes interessadas relevantes possam visualizá-los facilmente em qualquer navegador. Neste artigo, aprenderemos como converter documentos PDF em páginas da Web HTML usando C#.
Os seguintes tópicos serão abordados neste artigo:
- API C# para converter PDF em HTML — Download grátis
- Conversão de PDF para HTML usando C#
- Converter intervalo de páginas de PDF para HTML
- Converter páginas específicas de PDF para HTML
- Conversão de PDF para HTML com marca d’água em C #
API C# para converter PDF em HTML — Download grátis
Usaremos a API GroupDocs.Conversion for .NET para converter PDF em HTML. Ele fornece soluções de conversão de arquivos rápidas, eficientes e confiáveis para usuários finais. Por favor, baixe a DLL da API ou instale-a usando NuGet.
Install-Package GroupDocs.Conversion
Conversão de PDF para HTML usando C#
Podemos converter facilmente documentos PDF em páginas da Web HTML de forma programática, seguindo as etapas simples abaixo:
- Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento. É a classe principal que controla o processo de conversão de documentos.
- Em seguida, crie uma instância da classe MarkupConvertOptions. Ele fornece várias opções para conversão em tipos de arquivo de marcação.
- Em seguida, defina opcionalmente várias opções de conversão, como FixedLayout, FixedLayoutShowBorders, etc.
- Finalmente, chame o método Converter.Convert() para salvar o arquivo HTML convertido. Este método pega o caminho do arquivo de saída e converte as opções como um argumento.
O exemplo de código a seguir mostra como converter um documento PDF em uma página da Web HTML usando C#.
// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Defina as opções de conversão para o formato HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;
// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Converter intervalo de páginas de PDF para HTML
Podemos converter um intervalo de páginas de um documento PDF para HTML programaticamente seguindo as etapas abaixo:
- Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
- Em seguida, crie uma instância da classe MarkupConvertOptions.
- Em seguida, defina o número da página para iniciar a conversão de
- Depois disso, defina a contagem de páginas para converter o número total de páginas
- Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.
O exemplo de código a seguir mostra como converter um intervalo de páginas de um documento PDF em um arquivo HTML em C#.
// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert
// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);
Converter páginas específicas de PDF para HTML
Podemos converter páginas específicas de um documento PDF para HTML seguindo as etapas abaixo:
- Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
- Em seguida, crie uma instância da classe MarkupConvertOptions.
- Em seguida, forneça números de página específicos em uma lista separada por vírgulas para converter.
- Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.
O exemplo de código a seguir mostra como converter páginas específicas de um documento PDF em um arquivo HTML em C#.
// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert
// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);
Conversão de PDF para HTML com marca d’água em C
Podemos converter documentos PDF em páginas da Web HTML e adicionar marcas d’água a arquivos HTML convertidos programaticamente seguindo as etapas abaixo:
- Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
- Em seguida, crie uma instância da classe WatermarkOptions.
- Em seguida, defina várias opções, como Texto, Cor, Largura, Altura, Fonte, etc.
- Em seguida, crie uma instância da classe MarkupConvertOptions.
- Depois disso, atribua WatermarkOptions a MarkupConvertOptions.
- Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.
O exemplo de código a seguir mostra como converter um documento PDF em um documento HTML com uma marca d’água.
// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Definir marca d'água de texto
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
Color = Color.Red,
Width = 500,
Height = 100,
Top = 0,
Left = 300,
Background = true
};
// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;
// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Obtenha uma licença gratuita
Experimente a API sem limitações de avaliação solicitando uma licença temporária gratuita.
Conclusão
Neste artigo, aprendemos como converter documentos PDF em páginas da Web HTML em C#. Também vimos como converter páginas específicas de um PDF para HTML e adicionar uma marca d’água ao arquivo convertido programaticamente. Além disso, você pode aprender mais sobre GroupDocs.Conversion para .NET API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.