HTML(HyperText Markup Language) เป็นรูปแบบไฟล์ชั้นนำสำหรับหน้าเว็บที่ทุกเบราว์เซอร์รองรับ ในกรณีต่างๆ เราอาจจำเป็นต้องแปลงไฟล์ HTML หรือเนื้อหาจากหน้าเว็บที่ใช้งานจริงเป็นเอกสาร Word (DOC, DOCX, DOT, DOTM, DOCM ) ช่วยในการแก้ไขข้อความของหน้าเว็บ HTML หรือใช้การจัดรูปแบบข้อความ ในบทความนี้ เราจะเรียนรู้วิธีแปลง HTML เป็นเอกสาร Word โดยใช้ C#
หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:
- C# API เพื่อแปลง HTML เป็น DOCX — ดาวน์โหลดฟรี
- แปลง HTML เป็น Word ใน C#
- แปลงเว็บเพจเป็น Word จาก URL ใน C#
- การแปลงสตริง HTML เป็น Word โดยใช้ C#
C# API เพื่อแปลง HTML เป็น DOCX — ดาวน์โหลดฟรี
สำหรับการแปลงไฟล์ HTML หรือหน้าเว็บเป็นรูปแบบไฟล์ประมวลผล Word เราจะใช้ Aspose.Words for .NET API เป็นโซลูชั่นที่สมบูรณ์สำหรับการสร้าง แก้ไข แปลง หรือวิเคราะห์เอกสาร Word โดยทางโปรแกรม โปรด ดาวน์โหลด DLL ของ API หรือติดตั้งโดยใช้ NuGet
Install-Package Aspose.Words
C# แปลง HTML เป็น Word - บทช่วยสอนสั้น ๆ
เราสามารถแปลงไฟล์ HTML เป็นเอกสาร Word โดยทางโปรแกรมได้อย่างง่ายดายโดยทำตามขั้นตอนด้านล่าง:
- โหลดไฟล์ HTML โดยใช้คลาส Document
- เรียกเมธอด Document.Save(string, SaveFormat) เพื่อบันทึกไฟล์ HTML เป็น “output.docx"
การแจงนับ SaveFormat ใน Document.Save() จะระบุรูปแบบที่คุณต้องการแปลงไฟล์ HTML ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงไฟล์ HTML เป็น DOCX โดยใช้ C#
// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลงไฟล์ HTML เป็นเอกสาร Word โดยใช้ C#
// โหลดไฟล์ HTML โดยใช้คลาสเอกสาร
Document document = new Document(@"C:\Files\sample.html");
// แปลงไฟล์ HTML เป็นรูปแบบ Word DOCX
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);
C# แปลงเว็บเพจเป็น Word จาก URL - การสอนแบบทีละขั้นตอน
นอกจากนี้เรายังสามารถแปลงเว็บเพจ HTML ได้โดยตรงจาก URL สดเป็นเอกสาร Word โดยทำตามขั้นตอนที่ระบุด้านล่าง:
- ขั้นแรก ดาวน์โหลดเนื้อหาหน้าเว็บเป็นอาร์เรย์ System.Byte จาก URL ที่ระบุ
- จากนั้น เริ่มต้นอ็อบเจ็กต์ MemoryStream ด้วยอ็อบเจ็กต์อาร์เรย์เป็นอาร์กิวเมนต์
- จากนั้นสร้างอินสแตนซ์ของคลาส HtmlLoadOptions
- หลังจากนั้น ให้สร้างอินสแตนซ์ของคลาส Document และเริ่มต้นด้วยออบเจ็กต์ MemoryStream และ HtmlLoadOptions
- สุดท้าย ให้เรียกเมธอด Document.Save(string, SaveFormat) เพื่อบันทึกไฟล์ HTML เป็น “output.docx"
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเว็บเพจ HTML เป็น DOCX โดยใช้ C#
// ตัวอย่างโค้ดนี้สาธิตวิธีการบันทึกหน้าเว็บ HTML โดยตรงจาก URL แบบสดไปยังเอกสาร Word โดยใช้ C#
// URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";
// กำหนดตัวเลือกการโหลด HTML
HtmlLoadOptions options = new HtmlLoadOptions();
byte[] imageData = null;
// ดาวน์โหลดเนื้อหาจาก URL เป็นอาร์เรย์ไบต์
using (var wc = new System.Net.WebClient())
imageData = wc.DownloadData(Url);
// แปลงอาร์เรย์ไบต์เป็นสตรีม
var urlStream = new MemoryStream(imageData);
// สร้างอินสแตนซ์ของวัตถุเอกสาร
Document document = new Document(urlStream, options);
// บันทึกเป็น DOCX
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);
C# แปลงสตริง HTML เป็น Word - คู่มือฉบับย่อ
เราสามารถสร้างเอกสาร Word จากสตริง HTML แบบไดนามิกโดยทำตามขั้นตอนที่ระบุด้านล่าง:
- ขั้นแรก สร้างอินสแตนซ์ของคลาส Document
- จากนั้น สร้างอินสแตนซ์ของคลาส DocumentBuilder ด้วยอ็อบเจ็กต์ Document
- จากนั้น แทรก HTML ลงในเอกสารโดยใช้วิธี DocumentBuilder.InsertHtml(string)
- สุดท้าย ให้บันทึกเอกสาร Word โดยใช้วิธี Document.Save(string, SaveFormat)
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงสตริง HTML เป็น DOCX โดยใช้ C#
// ตัวอย่างโค้ดนี้สาธิตวิธีการสร้างเอกสาร Word จากสตริง HTML โดยใช้ C#
// สร้างเอกสารใหม่
Document document = new Document();
// สร้างตัวสร้างเอกสาร
DocumentBuilder builder = new DocumentBuilder(document);
// แทรก HTML
builder.InsertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// บันทึกเป็น DOCX
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);
รับใบอนุญาตฟรี
โปรดลองใช้ API โดยไม่มีข้อจำกัดในการประเมินโดยขอ ใบอนุญาตชั่วคราวฟรี
บทสรุป
ในบทช่วยสอนสั้นๆ นี้ เราได้เรียนรู้วิธีแปลง HTML เป็นเอกสาร Word โดยใช้ C# นอกจากนี้เรายังได้เห็นวิธีการแปลงหน้าเว็บสดจาก URL เป็นไฟล์ Word โดยทางโปรแกรม นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ Aspose.Words for .NET API ได้โดยใช้ เอกสารประกอบ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรั่ม