PDF — самый популярный формат для обмена и печати документов. В некоторых случаях нам может потребоваться преобразовать документы PDF в веб-страницы HTML. Такое преобразование помогает обмениваться содержимым PDF-документов, чтобы соответствующие заинтересованные стороны могли легко просматривать их в любом браузере. В этой статье мы узнаем, как конвертировать документы PDF в веб-страницы HTML с помощью C#.
В этой статье должны быть раскрыты следующие темы:
- C# API для преобразования PDF в HTML — скачать бесплатно
- Преобразование PDF в HTML с помощью C#
- Преобразование диапазона страниц из PDF в HTML
- Преобразование определенных страниц PDF в HTML
- Преобразование PDF в HTML с водяным знаком в C#
C# API для преобразования PDF в HTML — скачать бесплатно
Мы будем использовать API GroupDocs.Conversion for .NET для преобразования PDF в HTML. Он предоставляет конечным пользователям быстрые, эффективные и надежные решения для преобразования файлов. Пожалуйста, либо скачайте DLL API, либо установите его с помощью NuGet.
Install-Package GroupDocs.Conversion
Преобразование PDF в HTML с помощью C#
Мы можем легко программно конвертировать документы PDF в веб-страницы HTML, выполнив простые шаги, указанные ниже:
- Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента. Это основной класс, управляющий процессом преобразования документа.
- Затем создайте экземпляр класса MarkupConvertOptions. Он предоставляет различные варианты преобразования в типы файлов разметки.
- Затем при необходимости установите различные параметры преобразования, такие как FixedLayout, FixedLayoutShowBorders и т. д.
- Наконец, вызовите метод Converter.Convert(), чтобы сохранить преобразованный HTML-файл. Этот метод принимает путь к выходному файлу и параметры преобразования в качестве аргумента.
В следующем примере кода показано, как преобразовать документ PDF в веб-страницу HTML с помощью C#.
// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Установите параметры преобразования для формата HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;
// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Преобразование диапазона страниц из PDF в HTML
Мы можем программно преобразовать ряд страниц PDF-документа в HTML, выполнив следующие шаги:
- Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Затем установите номер страницы, с которой нужно начать преобразование.
- После этого установите количество страниц, чтобы преобразовать общее количество страниц.
- Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.
В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML на C#.
// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert
// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);
Преобразование определенных страниц PDF в HTML
Мы можем преобразовать определенные страницы документа PDF в HTML, выполнив следующие действия:
- Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Затем укажите конкретные номера страниц в списке через запятую для преобразования.
- Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.
В следующем примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML на C#.
// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert
// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);
Преобразование PDF в HTML с водяным знаком в C#
Мы можем конвертировать документы PDF в веб-страницы HTML и программно добавлять водяные знаки в преобразованные файлы HTML, выполнив следующие действия:
- Во-первых, загрузите PDF-документ, используя класс Converter с путем к входному файлу в качестве аргумента.
- Затем создайте экземпляр класса WatermarkOptions.
- Затем установите различные параметры, такие как текст, цвет, ширина, высота, шрифт и т. д.
- Затем создайте экземпляр класса MarkupConvertOptions.
- После этого назначьте WatermarkOptions для MarkupConvertOptions.
- Наконец, вызовите метод Converter.Convert() с путем к выходному файлу и параметрами преобразования, чтобы сохранить преобразованный HTML-файл.
В следующем примере кода показано, как преобразовать документ PDF в документ HTML с водяным знаком.
// Загрузите исходный файл PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");
// Определить текстовый водяной знак
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
Color = Color.Red,
Width = 500,
Height = 100,
Top = 0,
Left = 300,
Background = true
};
// Установите параметры преобразования для формата HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;
// Преобразование в формат HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Получить бесплатную лицензию
Пожалуйста, попробуйте API без ознакомительных ограничений, запросив бесплатную временную лицензию.
Вывод
В этой статье мы узнали, как конвертировать документы PDF в веб-страницы HTML на C#. Мы также увидели, как программно преобразовать определенные страницы PDF в HTML и добавить водяной знак в преобразованный файл. Кроме того, вы можете узнать больше о GroupDocs.Conversion for .NET API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.