Преобразование PDF в HTML с помощью C#

PDF — самый популярный формат для обмена и печати документов. В некоторых случаях нам может потребоваться преобразовать документы PDF в веб-страницы HTML. Такое преобразование помогает обмениваться содержимым PDF-документов, чтобы соответствующие заинтересованные стороны могли легко просматривать их в любом браузере. В этой статье мы узнаем, как конвертировать документы PDF в веб-страницы HTML с помощью C#.

В этой статье должны быть раскрыты следующие темы:

C# API для преобразования PDF в HTML — скачать бесплатно

Мы будем использовать API GroupDocs.Conversion for .NET для преобразования PDF в HTML. Он предоставляет конечным пользователям быстрые, эффективные и надежные решения для преобразования файлов. Пожалуйста, либо скачайте DLL API, либо установите его с помощью NuGet.

Install-Package GroupDocs.Conversion

Преобразование PDF в HTML с помощью C#

Мы можем легко программно конвертировать документы PDF в веб-страницы HTML, выполнив простые шаги, указанные ниже:

  1. Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента. Это основной класс, управляющий процессом преобразования документа.
  2. Затем создайте экземпляр класса MarkupConvertOptions. Он предоставляет различные варианты преобразования в типы файлов разметки.
  3. Затем при необходимости установите различные параметры преобразования, такие как FixedLayout, FixedLayoutShowBorders и т. д.
  4. Наконец, вызовите метод Converter.Convert(), чтобы сохранить преобразованный HTML-файл. Этот метод принимает путь к выходному файлу и параметры преобразования в качестве аргумента.

В следующем примере кода показано, как преобразовать документ PDF в веб-страницу HTML с помощью C#.

// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Установите параметры преобразования для формата HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Преобразование PDF в HTML на C#.

Преобразование PDF в HTML на C#.

Преобразование диапазона страниц из PDF в HTML

Мы можем программно преобразовать ряд страниц PDF-документа в HTML, выполнив следующие шаги:

  1. Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
  2. Затем создайте экземпляр класса MarkupConvertOptions.
  3. Затем установите номер страницы, с которой нужно начать преобразование.
  4. После этого установите количество страниц, чтобы преобразовать общее количество страниц.
  5. Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.

В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML на C#.

// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Преобразование определенных страниц PDF в HTML

Мы можем преобразовать определенные страницы документа PDF в HTML, выполнив следующие действия:

  1. Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
  2. Затем создайте экземпляр класса MarkupConvertOptions.
  3. Затем укажите конкретные номера страниц в списке через запятую для преобразования.
  4. Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.

В следующем примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML на C#.

// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Преобразование PDF в HTML с водяным знаком в C#

Мы можем конвертировать документы PDF в веб-страницы HTML и программно добавлять водяные знаки в преобразованные файлы HTML, выполнив следующие действия:

  1. Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
  2. Затем создайте экземпляр класса WatermarkOptions.
  3. Затем установите различные параметры, такие как текст, цвет, ширина, высота, шрифт и т. д.
  4. Затем создайте экземпляр класса MarkupConvertOptions.
  5. После этого назначьте WatermarkOptions для MarkupConvertOptions.
  6. Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.

В следующем примере кода показано, как преобразовать документ PDF в документ HTML с водяным знаком.

// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Определить текстовый водяной знак
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Преобразование PDF в HTML с водяным знаком на C#.

Преобразование PDF в HTML с водяным знаком на C#.

Получить бесплатную лицензию

Пожалуйста, попробуйте API без ознакомительных ограничений, запросив бесплатную временную лицензию.

Вывод

В этой статье мы узнали, как конвертировать документы PDF в веб-страницы HTML на C#. Мы также увидели, как программно преобразовать определенные страницы PDF в HTML и добавить водяной знак в преобразованный файл. Кроме того, вы можете узнать больше о GroupDocs.Conversion for .NET API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также