Convierte PDF a HTML usando C#

PDF es el formato más popular para compartir e imprimir documentos. En ciertos casos, es posible que necesitemos convertir documentos PDF a páginas web HTML. Dicha conversión ayuda a compartir el contenido de los documentos PDF para que las partes interesadas relevantes puedan verlos fácilmente en cualquier navegador. En este artículo, aprenderemos cómo convertir documentos PDF a páginas web HTML usando C#.

En este artículo se tratarán los siguientes temas:

API de C# para convertir PDF a HTML — Descarga gratuita

Usaremos GroupDocs.Conversion for .NET API para convertir PDF a HTML. Proporciona soluciones de conversión de archivos rápidas, eficientes y confiables para los usuarios finales. Descargue la DLL de la API o instálela usando NuGet.

Install-Package GroupDocs.Conversion

Conversión de PDF a HTML usando C#

Podemos convertir fácilmente documentos PDF a páginas web HTML mediante programación siguiendo los sencillos pasos que se indican a continuación:

  1. En primer lugar, cargue un documento PDF utilizando la clase Convertidor con la ruta del archivo de entrada como argumento. Es la clase principal que controla el proceso de conversión de documentos.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions. Proporciona varias opciones para la conversión a tipos de archivos de marcado.
  3. Luego, opcionalmente configure varias opciones de conversión como FixedLayout, FixedLayoutShowBorders, etc.
  4. Finalmente, llame al método Converter.Convert() para guardar el archivo HTML convertido. Este método toma la ruta del archivo de salida y convierte las opciones como argumento.

El siguiente ejemplo de código muestra cómo convertir un documento PDF en una página web HTML mediante C#.

// Cargue el archivo PDF de origen
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Establecer las opciones de conversión para el formato HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Convertir a formato HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Convierte PDF a HTML en C#.

Convierte PDF a HTML en C#.

Convertir rango de páginas de PDF a HTML

Podemos convertir un rango de páginas de un documento PDF a HTML mediante programación siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF utilizando la clase Convertidor con la ruta del archivo de entrada como argumento.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions.
  3. Luego, establezca el número de página para iniciar la conversión desde
  4. Después de eso, configure el recuento de páginas para convertir el número total de páginas
  5. Finalmente, llame al método Converter.Convert() con la ruta del archivo de salida y las opciones de conversión para guardar el archivo HTML convertido.

El siguiente ejemplo de código muestra cómo convertir un rango de páginas de un documento PDF a un archivo HTML en C#.

// Cargue el archivo PDF de origen
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Establecer las opciones de conversión para el formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Convertir a formato HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Convertir páginas específicas de PDF a HTML

Podemos convertir páginas específicas de un documento PDF a HTML siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF utilizando la clase Convertidor con la ruta del archivo de entrada como argumento.
  2. A continuación, cree una instancia de la clase MarkupConvertOptions.
  3. Luego, proporcione números de página específicos en una lista separada por comas para convertir.
  4. Finalmente, llame al método Converter.Convert() con la ruta del archivo de salida y las opciones de conversión para guardar el archivo HTML convertido.

El siguiente ejemplo de código muestra cómo convertir páginas específicas de un documento PDF en un archivo HTML en C#.

// Cargue el archivo PDF de origen
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Establecer las opciones de conversión para el formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Convertir a formato HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Conversión de PDF a HTML con marca de agua en C#

Podemos convertir documentos PDF a páginas web HTML y agregar marcas de agua a archivos HTML convertidos mediante programación siguiendo los pasos que se detallan a continuación:

  1. En primer lugar, cargue un documento PDF utilizando la clase Convertidor con la ruta del archivo de entrada como argumento.
  2. A continuación, cree una instancia de la clase WatermarkOptions.
  3. Luego, configure varias opciones como Texto, Color, Ancho, Alto, Fuente, etc.
  4. A continuación, cree una instancia de la clase MarkupConvertOptions.
  5. Después de eso, asigne WatermarkOptions a MarkupConvertOptions.
  6. Finalmente, llame al método Converter.Convert() con la ruta del archivo de salida y las opciones de conversión para guardar el archivo HTML convertido.

El siguiente ejemplo de código muestra cómo convertir un documento PDF en un documento HTML con una marca de agua.

// Cargue el archivo PDF de origen
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Definir marca de agua de texto
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Establecer las opciones de conversión para el formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Convertir a formato HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Conversión de PDF a HTML con marca de agua en C#.

Conversión de PDF a HTML con marca de agua en C#.

Obtenga una licencia gratis

Pruebe la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, hemos aprendido cómo convertir documentos PDF a páginas web HTML en C#. También hemos visto cómo convertir páginas específicas de un PDF a HTML y agregar una marca de agua al archivo convertido mediante programación. Además, puede obtener más información sobre GroupDocs.Conversion para la API de .NET utilizando la documentación. En caso de cualquier ambigüedad, no dude en contactarnos en el foro.

Ver también