تبدیل HTML به Word DOCX با استفاده از C#

HTML(زبان نشانه‌گذاری هایپرمتن) یک فرمت فایل پیشرو برای صفحات وب است که توسط تمام مرورگرها پشتیبانی می‌شود. در موارد مختلف، ممکن است نیاز داشته باشیم که فایل‌ها یا محتوای HTML از وب‌سایت‌های زنده را به مدارک ورد (DOC، DOCX، DOT، DOTM، DOCM) تبدیل کنیم. این ابزار به ویرایش متن صفحات وب HTML یا اعمال فرمت‌بندی متن کمک می‌کند. در این مقاله، خواهیم آموخت که چگونه HTML را به یک سند ورد DOC یا DOCX با استفاده از C# تبدیل کنیم.

موضوعات زیر در این مقاله بررسی خواهند شد:

API C# برای تبدیل HTML به DOCX - دانلود رایگان

برای تبدیل فایل‌های HTML یا وب‌سایت‌ها به فرمت‌های فایل پردازش متن، ما از API Aspose.Words for .NET استفاده خواهیم کرد. این یک راه‌حل کامل برای ایجاد، ویرایش، تبدیل یا تجزیه و تحلیل اسناد Word به صورت برنامه‌نویسی است. لطفاً یا دانلود DLL API را انجام دهید یا آن را با استفاده از NuGet نصب کنید.

Install-Package Aspose.Words

C# تبدیل HTML به فایل Word DOCX

ما می‌توانیم به راحتی فایل‌های HTML را به صورت برنامه‌نویسی در C# به مدارک Word تبدیل کنیم با دنبال کردن مراحل زیر:

  1. Load an HTML file using the Document class.
  2. Call the Document.Save(string, SaveFormat) method to save the HTML file as `output.docx”.

SaveFormat enumeration در متد Document.Save() فرمت مورد نظر شما را مشخص می‌کند که می‌خواهید فایل HTML را به آن تبدیل کنید. نمونه کد زیر نشان می‌دهد که چگونه می‌توانید یک فایل HTML را با استفاده از C# به DOCX تبدیل کنید.

// این مثال کد نشان می‌دهد که چگونه یک فایل HTML را با استفاده از C# به یک سند Word تبدیل کنیم.
// بارگذاری فایل HTML با استفاده از کلاس Document
Document document = new Document(@"C:\Files\sample.html");

// فایل HTML را به فرمت DOCX مایکروسافت ورد تبدیل کنید.
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);
تبدیل HTML به Word در C#

تبدیل HTML به Word در C#

C# تبدیل یک صفحه وب به Word از URL

ما می‌توانیم یک صفحه وب HTML را به طور مستقیم از یک URL زنده به یک سند Word در C# با پیروی از مراحل زیر تبدیل کنیم:

  1. در ابتدا، محتویات صفحه وب را به عنوان یک آرایه System.Byte از URL مشخص شده دانلود کنید.
  2. سپس شیء MemoryStream را با یک آرایه به عنوان آرگومان راه‌اندازی کنید.
  3. سپس، یک نمونه از کلاس HtmlLoadOptions ایجاد کنید.
  4. پس از آن، یک نمونه از کلاس Document ایجاد کرده و آن را با اشیاء MemoryStream و HtmlLoadOptions راه‌اندازی کنید.
  5. Finally, call the Document.Save(string, SaveFormat) method to save the HTML file as `output.docx”.

نمونه کد زیر نشان می‌دهد که چگونه یک صفحه وب HTML را با استفاده از C# به DOCX تبدیل کنید.

// این مثال کد نشان می‌دهد که چگونه صفحه وب HTML را به‌طور مستقیم از یک URL زنده به یک سند Word با استفاده از C# ذخیره کنیم.
// The URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";

// تعریف گزینه‌های بارگذاری HTML 
HtmlLoadOptions options = new HtmlLoadOptions();

byte[] imageData = null;

// محتوا را از URL به عنوان آرایه بایت دانلود کنید
using (var wc = new System.Net.WebClient())
    imageData = wc.DownloadData(Url);

// Byte array را به استریم تبدیل کنید
var urlStream =  new MemoryStream(imageData);

// یک نمونه از شی Document ایجاد کنید
Document document = new Document(urlStream, options);

// Save as DOCX
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);

C# تبدیل یک رشته HTML به Word

ما می‌توانیم به‌طور پویا یک سند Word از یک رشته HTML در C# با دنبال کردن مراحل زیر تولید کنیم:

  1. ابتدا، یک نمونه از کلاس Document را ایجاد کنید.
  2. در مرحله بعد، یک نمونه از کلاس DocumentBuilder را با شیء Document ایجاد کنید.
  3. سپس، HTML را با استفاده از DocumentBuilder.InsertHtml(string) متد در سند وارد کنید.
  4. در نهایت، سند Word را با استفاده از Document.Save(string, SaveFormat) متد ذخیره کنید.

نمونه کد زیر نشان می‌دهد که چگونه یک رشته HTML را با استفاده از C# به DOCX تبدیل کنیم.

// این مثال کد نشان می‌دهد که چگونه یک سند Word از یک رشته HTML با استفاده از C# ایجاد کنیم.
// Create a new document
Document document = new Document();

// Create a document builder
DocumentBuilder builder = new DocumentBuilder(document);

// Insert HTML
builder.InsertHtml("<ul>\r\n" +
    "<li>Item1</li>\r\n" +
    "<li>Item2</li>\r\n" +
    "</ul>");

// Save as DOCX
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);

یک مجوز رایگان بگیرید

لطفاً سعی کنید API را بدون محدودیت های ارزیابی با درخواست یک مجوز موقت رایگان امتحان کنید.

نتیجه گیری

در این آموزش کوتاه، ما یاد گرفتیم که چگونه HTML را به یک سند Word با استفاده از C# تبدیل کنیم. همچنین دیده‌ایم که چگونه می‌توان صفحات وب زنده را از یک URL به فایل‌های Word DOC یا DOCX به صورت برنامه‌نویسی تبدیل کرد. علاوه بر این، می‌توانید بیشتر در مورد Aspose.Words برای API .NET با استفاده از documentation یاد بگیرید. در صورت هر گونه ابهام، لطفاً با ما در forum تماس بگیرید.

همچنین ببینید