แปลง HTML เป็นเอกสาร Word โดยใช้ C#

HTML(HyperText Markup Language) เป็นรูปแบบไฟล์ชั้นนำสำหรับหน้าเว็บที่ทุกเบราว์เซอร์รองรับ ในกรณีต่างๆ เราอาจจำเป็นต้องแปลงไฟล์ HTML หรือเนื้อหาจากหน้าเว็บที่ใช้งานจริงเป็นเอกสาร Word (DOC, DOCX, DOT, DOTM, DOCM ) ช่วยในการแก้ไขข้อความของหน้าเว็บ HTML หรือใช้การจัดรูปแบบข้อความ ในบทความนี้ เราจะเรียนรู้วิธีแปลง HTML เป็นเอกสาร Word โดยใช้ C#

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

C# API เพื่อแปลง HTML เป็น DOCX — ดาวน์โหลดฟรี

สำหรับการแปลงไฟล์ HTML หรือหน้าเว็บเป็นรูปแบบไฟล์ประมวลผล Word เราจะใช้ Aspose.Words for .NET API เป็นโซลูชั่นที่สมบูรณ์สำหรับการสร้าง แก้ไข แปลง หรือวิเคราะห์เอกสาร Word โดยทางโปรแกรม โปรด ดาวน์โหลด DLL ของ API หรือติดตั้งโดยใช้ NuGet

Install-Package Aspose.Words

C# แปลง HTML เป็น Word - บทช่วยสอนสั้น ๆ

เราสามารถแปลงไฟล์ HTML เป็นเอกสาร Word โดยทางโปรแกรมได้อย่างง่ายดายโดยทำตามขั้นตอนด้านล่าง:

  1. โหลดไฟล์ HTML โดยใช้คลาส Document
  2. เรียกเมธอด Document.Save(string, SaveFormat) เพื่อบันทึกไฟล์ HTML เป็น “output.docx"

การแจงนับ SaveFormat ใน Document.Save() จะระบุรูปแบบที่คุณต้องการแปลงไฟล์ HTML ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ HTML เป็น DOCX โดยใช้ C#

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลงไฟล์ HTML เป็นเอกสาร Word โดยใช้ C#
// โหลดไฟล์ HTML โดยใช้คลาสเอกสาร
Document document = new Document(@"C:\Files\sample.html");

// แปลงไฟล์ HTML เป็นรูปแบบ Word DOCX
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);

C# แปลงเว็บเพจเป็น Word จาก URL - การสอนแบบทีละขั้นตอน

นอกจากนี้เรายังสามารถแปลงเว็บเพจ HTML ได้โดยตรงจาก URL สดเป็นเอกสาร Word โดยทำตามขั้นตอนที่ระบุด้านล่าง:

  1. ขั้นแรก ดาวน์โหลดเนื้อหาหน้าเว็บเป็นอาร์เรย์ System.Byte จาก URL ที่ระบุ
  2. จากนั้น เริ่มต้นอ็อบเจ็กต์ MemoryStream ด้วยอ็อบเจ็กต์อาร์เรย์เป็นอาร์กิวเมนต์
  3. จากนั้นสร้างอินสแตนซ์ของคลาส HtmlLoadOptions
  4. หลังจากนั้น ให้สร้างอินสแตนซ์ของคลาส Document และเริ่มต้นด้วยออบเจ็กต์ MemoryStream และ HtmlLoadOptions
  5. สุดท้าย ให้เรียกเมธอด Document.Save(string, SaveFormat) เพื่อบันทึกไฟล์ HTML เป็น “output.docx"

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเว็บเพจ HTML เป็น DOCX โดยใช้ C#

// ตัวอย่างโค้ดนี้สาธิตวิธีการบันทึกหน้าเว็บ HTML โดยตรงจาก URL แบบสดไปยังเอกสาร Word โดยใช้ C#
// URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";

// กำหนดตัวเลือกการโหลด HTML 
HtmlLoadOptions options = new HtmlLoadOptions();

byte[] imageData = null;

// ดาวน์โหลดเนื้อหาจาก URL เป็นอาร์เรย์ไบต์
using (var wc = new System.Net.WebClient())
    imageData = wc.DownloadData(Url);

// แปลงอาร์เรย์ไบต์เป็นสตรีม
var urlStream =  new MemoryStream(imageData);

// สร้างอินสแตนซ์ของวัตถุเอกสาร
Document document = new Document(urlStream, options);

// บันทึกเป็น DOCX
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);

C# แปลงสตริง HTML เป็น Word - คู่มือฉบับย่อ

เราสามารถสร้างเอกสาร Word จากสตริง HTML แบบไดนามิกโดยทำตามขั้นตอนที่ระบุด้านล่าง:

  1. ขั้นแรก สร้างอินสแตนซ์ของคลาส Document
  2. จากนั้น สร้างอินสแตนซ์ของคลาส DocumentBuilder ด้วยอ็อบเจ็กต์ Document
  3. จากนั้น แทรก HTML ลงในเอกสารโดยใช้วิธี DocumentBuilder.InsertHtml(string)
  4. สุดท้าย ให้บันทึกเอกสาร Word โดยใช้วิธี Document.Save(string, SaveFormat)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงสตริง HTML เป็น DOCX โดยใช้ C#

// ตัวอย่างโค้ดนี้สาธิตวิธีการสร้างเอกสาร Word จากสตริง HTML โดยใช้ C#
// สร้างเอกสารใหม่
Document document = new Document();

// สร้างตัวสร้างเอกสาร
DocumentBuilder builder = new DocumentBuilder(document);

// แทรก HTML
builder.InsertHtml("<ul>\r\n" +
    "<li>Item1</li>\r\n" +
    "<li>Item2</li>\r\n" +
    "</ul>");

// บันทึกเป็น DOCX
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);

รับใบอนุญาตฟรี

โปรดลองใช้ API โดยไม่มีข้อจำกัดในการประเมินโดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทช่วยสอนสั้นๆ นี้ เราได้เรียนรู้วิธีแปลง HTML เป็นเอกสาร Word โดยใช้ C# นอกจากนี้เรายังได้เห็นวิธีการแปลงหน้าเว็บสดจาก URL เป็นไฟล์ Word โดยทางโปรแกรม นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.Words for .NET API ได้โดยใช้ เอกสารประกอบ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรั่ม

ดูสิ่งนี้ด้วย