Converter PDF para HTML usando C#

PDF é o formato mais popular para compartilhamento e impressão de documentos. Em certos casos, podemos precisar converter documentos PDF em páginas da Web HTML. Essa conversão ajuda a compartilhar o conteúdo de documentos PDF para que as partes interessadas relevantes possam visualizá-los facilmente em qualquer navegador. Neste artigo, aprenderemos como converter documentos PDF em páginas da Web HTML usando C#.

Os seguintes tópicos serão abordados neste artigo:

API C# para converter PDF em HTML — Download grátis

Usaremos a API GroupDocs.Conversion for .NET para converter PDF em HTML. Ele fornece soluções de conversão de arquivos rápidas, eficientes e confiáveis para usuários finais. Por favor, baixe a DLL da API ou instale-a usando NuGet.

Install-Package GroupDocs.Conversion

Conversão de PDF para HTML usando C#

Podemos converter facilmente documentos PDF em páginas da Web HTML de forma programática, seguindo as etapas simples abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento. É a classe principal que controla o processo de conversão de documentos.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions. Ele fornece várias opções para conversão em tipos de arquivo de marcação.
  3. Em seguida, defina opcionalmente várias opções de conversão, como FixedLayout, FixedLayoutShowBorders, etc.
  4. Finalmente, chame o método Converter.Convert() para salvar o arquivo HTML convertido. Este método pega o caminho do arquivo de saída e converte as opções como um argumento.

O exemplo de código a seguir mostra como converter um documento PDF em uma página da Web HTML usando C#.

// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Defina as opções de conversão para o formato HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Converta PDF para HTML em C#.

Converta PDF para HTML em C#.

Converter intervalo de páginas de PDF para HTML

Podemos converter um intervalo de páginas de um documento PDF para HTML programaticamente seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions.
  3. Em seguida, defina o número da página para iniciar a conversão de
  4. Depois disso, defina a contagem de páginas para converter o número total de páginas
  5. Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.

O exemplo de código a seguir mostra como converter um intervalo de páginas de um documento PDF em um arquivo HTML em C#.

// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Converter páginas específicas de PDF para HTML

Podemos converter páginas específicas de um documento PDF para HTML seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions.
  3. Em seguida, forneça números de página específicos em uma lista separada por vírgulas para converter.
  4. Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.

O exemplo de código a seguir mostra como converter páginas específicas de um documento PDF em um arquivo HTML em C#.

// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Conversão de PDF para HTML com marca d’água em C

Podemos converter documentos PDF em páginas da Web HTML e adicionar marcas d’água a arquivos HTML convertidos programaticamente seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter com o caminho do arquivo de entrada como argumento.
  2. Em seguida, crie uma instância da classe WatermarkOptions.
  3. Em seguida, defina várias opções, como Texto, Cor, Largura, Altura, Fonte, etc.
  4. Em seguida, crie uma instância da classe MarkupConvertOptions.
  5. Depois disso, atribua WatermarkOptions a MarkupConvertOptions.
  6. Finalmente, chame o método Converter.Convert() com o caminho do arquivo de saída e as opções de conversão para salvar o arquivo HTML convertido.

O exemplo de código a seguir mostra como converter um documento PDF em um documento HTML com uma marca d’água.

// Carregar o arquivo PDF de origem
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Definir marca d'água de texto
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Defina as opções de conversão para o formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Converter para formato HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Conversão de PDF para HTML com marca d'água em C#.

Conversão de PDF para HTML com marca d’água em C#.

Obtenha uma licença gratuita

Experimente a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, aprendemos como converter documentos PDF em páginas da Web HTML em C#. Também vimos como converter páginas específicas de um PDF para HTML e adicionar uma marca d’água ao arquivo convertido programaticamente. Além disso, você pode aprender mais sobre GroupDocs.Conversion para .NET API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.

Veja também