แปลง PDF เป็น HTML โดยใช้ C#

PDF เป็นรูปแบบที่นิยมที่สุดสำหรับการแชร์และพิมพ์เอกสาร ในบางกรณี เราอาจต้องแปลงเอกสาร PDF เป็นหน้าเว็บ HTML การแปลงดังกล่าวช่วยในการแบ่งปันเนื้อหาของเอกสาร PDF เพื่อให้ผู้มีส่วนได้ส่วนเสียที่เกี่ยวข้องสามารถดูได้จากเบราว์เซอร์ใดๆ ก็ตามได้อย่างง่ายดาย ในบทความนี้ เราจะเรียนรู้วิธีแปลงเอกสาร PDF เป็นเว็บเพจ HTML โดยใช้ C#

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

C# API เพื่อแปลง PDF เป็น HTML — ดาวน์โหลดฟรี

เราจะใช้ GroupDocs.Conversion for .NET API เพื่อแปลง PDF เป็น HTML ให้บริการโซลูชั่นการแปลงไฟล์ที่รวดเร็ว มีประสิทธิภาพ และเชื่อถือได้แก่ผู้ใช้ โปรด ดาวน์โหลด DLL ของ API หรือติดตั้งโดยใช้ NuGet

Install-Package GroupDocs.Conversion

การแปลง PDF เป็น HTML โดยใช้ C#

เราสามารถแปลงเอกสาร PDF เป็นเว็บเพจ HTML ได้อย่างง่ายดายโดยทางโปรแกรมโดยทำตามขั้นตอนง่ายๆ ที่ระบุด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter โดยมีเส้นทางไฟล์อินพุตเป็นอาร์กิวเมนต์ เป็นคลาสหลักที่ควบคุมกระบวนการแปลงเอกสาร
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions มีตัวเลือกต่างๆ สำหรับการแปลงเป็นไฟล์ประเภทมาร์กอัป
  3. จากนั้นเลือกตั้งค่าตัวเลือกการแปลงต่างๆ เช่น FixLayout, FixLayoutShowBorders เป็นต้น
  4. สุดท้าย ให้เรียกใช้เมธอด Converter.Convert() เพื่อบันทึกไฟล์ HTML ที่แปลงแล้ว วิธีการนี้ใช้เส้นทางของไฟล์เอาต์พุตและแปลงตัวเลือกเป็นอาร์กิวเมนต์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF เป็นเว็บเพจ HTML โดยใช้ C#

// โหลดไฟล์ PDF ต้นฉบับ
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// ตั้งค่าตัวเลือกการแปลงสำหรับรูปแบบ HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// แปลงเป็นรูปแบบ HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
แปลง PDF เป็น HTML ใน C#

แปลง PDF เป็น HTML ใน C#

แปลงช่วงของหน้าจาก PDF เป็น HTML

เราสามารถแปลงช่วงหน้าของเอกสาร PDF เป็น HTML โดยทางโปรแกรมโดยทำตามขั้นตอนที่ระบุด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter โดยมีเส้นทางไฟล์อินพุตเป็นอาร์กิวเมนต์
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  3. จากนั้นตั้งค่าหมายเลขหน้าเพื่อเริ่มการแปลง
  4. หลังจากนั้นให้ตั้งค่าจำนวนหน้าเพื่อแปลงจำนวนหน้าทั้งหมด
  5. สุดท้าย ให้เรียกเมธอด Converter.Convert() พร้อมเส้นทางไฟล์เอาต์พุตและตัวเลือกการแปลงเพื่อบันทึกไฟล์ HTML ที่แปลงแล้ว

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงช่วงของหน้าจากเอกสาร PDF ไปเป็นไฟล์ HTML ใน C#

// โหลดไฟล์ PDF ต้นฉบับ
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// ตั้งค่าตัวเลือกการแปลงสำหรับรูปแบบ HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// แปลงเป็นรูปแบบ HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

แปลงหน้าเฉพาะของ PDF เป็น HTML

เราสามารถแปลงหน้าเฉพาะของเอกสาร PDF เป็น HTML ได้โดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter โดยมีเส้นทางไฟล์อินพุตเป็นอาร์กิวเมนต์
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  3. จากนั้น ระบุหมายเลขหน้าเฉพาะในรายการที่คั่นด้วยเครื่องหมายจุลภาคเพื่อทำการแปลง
  4. สุดท้าย ให้เรียกเมธอด Converter.Convert() พร้อมเส้นทางไฟล์เอาต์พุตและตัวเลือกการแปลงเพื่อบันทึกไฟล์ HTML ที่แปลงแล้ว

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงหน้าเฉพาะของเอกสาร PDF เป็นไฟล์ HTML ใน C#

// โหลดไฟล์ PDF ต้นฉบับ
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// ตั้งค่าตัวเลือกการแปลงสำหรับรูปแบบ HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// แปลงเป็นรูปแบบ HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

การแปลง PDF เป็น HTML พร้อมลายน้ำใน C#

เราสามารถแปลงเอกสาร PDF เป็นหน้าเว็บ HTML และเพิ่มลายน้ำให้กับไฟล์ HTML ที่แปลงโดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter โดยมีเส้นทางไฟล์อินพุตเป็นอาร์กิวเมนต์
  2. จากนั้น สร้างอินสแตนซ์ของคลาส WatermarkOptions
  3. จากนั้นตั้งค่าตัวเลือกต่างๆ เช่น ข้อความ สี ความกว้าง ความสูง แบบอักษร ฯลฯ
  4. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  5. หลังจากนั้นให้กำหนด WatermarkOptions ให้กับ MarkupConvertOptions
  6. สุดท้าย ให้เรียกเมธอด Converter.Convert() พร้อมเส้นทางไฟล์เอาต์พุตและตัวเลือกการแปลงเพื่อบันทึกไฟล์ HTML ที่แปลงแล้ว

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF เป็นเอกสาร HTML ที่มีลายน้ำ

// โหลดไฟล์ PDF ต้นฉบับ
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// กำหนดลายน้ำข้อความ
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// ตั้งค่าตัวเลือกการแปลงสำหรับรูปแบบ HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// แปลงเป็นรูปแบบ HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
การแปลง PDF เป็น HTML พร้อมลายน้ำใน C#

การแปลง PDF เป็น HTML พร้อมลายน้ำใน C#

รับใบอนุญาตฟรี

โปรดลองใช้ API โดยไม่มีข้อจำกัดในการประเมินโดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ เราได้เรียนรู้วิธีแปลงเอกสาร PDF เป็นเว็บเพจ HTML ใน C# นอกจากนี้เรายังได้เห็นวิธีการแปลงหน้าเฉพาะของ PDF เป็น HTML และเพิ่มลายน้ำให้กับไฟล์ที่แปลงโดยทางโปรแกรม นอกจากนี้ คุณยังสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Conversion สำหรับ .NET API ได้โดยใช้ เอกสารประกอบ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรั่ม

ดูสิ่งนี้ด้วย