تبدیل PDF به HTML با استفاده از C#

PDF فرمت محبوب‌تری برای به اشتراک‌گذاری و چاپ مدارک است. در موارد خاص، ممکن است نیاز داشته باشیم که مدارک PDF را به HTML صفحات وب تبدیل کنیم. چنین تبدیلی کمک می‌کند تا محتوای مدارک PDF به‌گونه‌ای به اشتراک گذاشته شود که ذینفعان مرتبط بتوانند به سادگی آن‌ها را در هر مرورگری مشاهده کنند. در این مقاله، یاد خواهیم گرفت که چگونه مدارک PDF را به صفحات وب HTML با استفاده از C# تبدیل کنیم.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

API C# برای تبدیل PDF به HTML — دانلود رایگان

ما از API GroupDocs.Conversion for .NET برای تبدیل PDF به HTML در C# استفاده خواهیم کرد. این API راه‌حل‌های سریع، کارآمد و قابل اعتمادی برای تبدیل فایل به کاربران نهایی ارائه می‌دهد. لطفاً DLL این API را دانلود کنید یا آن را با استفاده از NuGet نصب کنید.

Install-Package GroupDocs.Conversion

تبدیل PDF به HTML با استفاده از C#

ما می‌توانیم به راحتی اسناد PDF را به صفحات وب HTML به صورت برنامه‌نویسی در C# با دنبال کردن مراحل ساده زیر تبدیل کنیم:

  1. ابتدا، یک سند PDF را با استفاده از کلاس Converter بارگذاری کنید که مسیر فایل ورودی به عنوان آرگومان باشد. این کلاس اصلی است که فرایند تبدیل سند را کنترل می‌کند.
  2. بعدی، یک نمونه از کلاس MarkupConvertOptions را ایجاد کنید. این کلاس گزینه‌های مختلفی برای تبدیل به نوع فایل‌های Markup ارائه می‌دهد.
  3. سپس، به صورت اختیاری گزینه‌های تبدیل مختلفی مانند FixedLayout، FixedLayoutShowBorders و غیره را تنظیم کنید.
  4. در نهایت، متد Converter.Convert() را برای ذخیره فایل HTML تبدیل شده فراخوانی کنید. این متد مسیر فایل خروجی و گزینه‌های تبدیل را به‌عنوان آرگومان می‌گیرد.

کد نمونه زیر نشان می‌دهد چگونه یک سند PDF را به یک صفحه وب HTML با استفاده از C# تبدیل کنید.

// Load the source PDF file
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// گزینه‌های تبدیل را برای فرمت HTML تنظیم کنید
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Convert to HTML format
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Convert PDF to HTML in C#.

PDF را به HTML در C# تبدیل کنید.

مبدل محدوده صفحات از PDF به HTML در C#

ما می‌توانیم یک دامنه از صفحات یک سند PDF را به صورت برنامه‌نویسی به HTML تبدیل کنیم با دنبال کردن مراحل زیر:

  1. Firstly, load a PDF document using the Converter class with input file path as argument.
  2. بعد، یک نمونه از کلاس MarkupConvertOptions ایجاد کنید.
  3. سپس، شماره صفحه را برای شروع تبدیل تنظیم کنید
  4. پس از آن، تعداد صفحات را برای تبدیل به تعداد کل صفحات تنظیم کنید
  5. در نهایت، باز کردن متد Converter.Convert() با مسیر فایل خروجی و گزینه‌های تبدیل برای ذخیره‌سازی فایل HTML تبدیل شده.

کد نمونه زیر نشان می‌دهد که چگونه می‌توانیم یک محدوده صفحات را از یک سند PDF به یک فایل HTML در C# تبدیل کنیم.

// بارگذاری فایل PDF منبع
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// گزینه‌های تبدیل را برای فرمت HTML تنظیم کنید
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Convert to HTML format
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

صفحات خاصی از PDF را به HTML در C# تبدیل کنید

ما می‌توانیم صفحات خاصی از یک سند PDF را با دنبال کردن مراحل زیر به HTML تبدیل کنیم:

  1. Firstly, load a PDF document using the Converter class with input file path as argument.
  2. بعد، یک نمونه از کلاس MarkupConvertOptions ایجاد کنید.
  3. سپس، شماره صفحات خاصی را در یک لیست جدا شده با کاما برای تبدیل ارائه دهید.
  4. در نهایت، متد Converter.Convert() را با مسیر فایل خروجی و گزینه‌های تبدیل فراخوانی کنید تا فایل HTML تبدیل شده را ذخیره کند.

کد نمونه زیر نشان می‌دهد که چگونه می‌توان صفحات خاصی از یک سند PDF را به یک فایل HTML در C# تبدیل کرد.

// فایل PDF منبع را بارگذاری کنید
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// گزینه‌های تبدیل را برای فرمت HTML تنظیم کنید
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Convert to HTML format
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

تبدیل PDF به HTML با واترمارک در C#

ما می‌توانیم اسناد PDF را به صفحات وب HTML تبدیل کرده و به فایل‌های HTML تبدیل شده به صورت برنامه‌نویسی علامت آب اضافه کنیم با دنبال کردن مراحل زیر:

  1. Firstly, load a PDF document using the Converter class with input file path as argument.
  2. Next, create an instance of the WatermarkOptions class.
  3. سپس گزینه‌های مختلفی مانند متن، رنگ، عرض، ارتفاع، فونت و غیره را تنظیم کنید.
  4. در مرحله بعد، یک نمونه از کلاس MarkupConvertOptions ایجاد کنید.
  5. پس از آن، WatermarkOptions را به MarkupConvertOptions اختصاص دهید.
  6. در نهایت، متد Converter.Convert() را با مسیر فایل خروجی و گزینه‌های تبدیل برای ذخیره فایل HTML تبدیل شده فراخوانی کنید.

کد نمونه زیر نشان می‌دهد که چگونه می‌توان یک سند PDF را به یک سند HTML با یک واترمارک در C# تبدیل کرد.

// فایل PDF منبع را بارگذاری کنید
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// متن واترمارک را تعریف کنید
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// گزینه‌های تبدیل را برای فرمت HTML تنظیم کنید
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Convert to HTML format
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
تبدیل PDF به HTML با واترمارک در C#.

تبدیل PDF به HTML با واترمارک در C#.

یک مجوز رایگان بگیرید

لطفاً سعی کنید API را بدون محدودیت‌های ارزیابی با درخواست a free temporary license امتحان کنید.

نتیجه گیری

در این مقاله، ما یاد گرفته‌ایم که چگونه نسخه‌های PDF را به صفحات HTML در C# تبدیل کنیم. همچنین دیده‌ایم که چگونه صفحات خاصی از یک PDF را به HTML تبدیل کنیم و به فایل تبدیل‌شده به‌طور برنامه‌نویسی واترمارک اضافه کنیم. علاوه بر این، می‌توانید اطلاعات بیشتری درباره GroupDocs.Conversion برای API .NET با استفاده از documentation یاد بگیرید. در صورت هر گونه ابهام، لطفاً احساس راحتی کنید و با ما در forum تماس بگیرید.

همچنین ببینید