แปลง PDF เป็น HTML โดยใช้ Java

PDF เสนอให้แชร์และพิมพ์เอกสารแบบอ่านอย่างเดียวโดยไม่สูญเสียการจัดรูปแบบเอกสาร เราสามารถแปลงเอกสาร PDF เป็นหน้าเว็บ HTML และดูได้ในเบราว์เซอร์ใดก็ได้ ในบทความนี้ เราจะเรียนรู้วิธีแปลงเอกสาร PDF เป็นเว็บเพจ HTML โดยใช้ Java

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Java API เพื่อแปลง PDF เป็น HTML — ดาวน์โหลดฟรี

สำหรับการแปลง PDF เป็น HTML เราจะใช้ GroupDocs.Conversion for Java API ให้บริการโซลูชั่นการแปลงไฟล์ที่รวดเร็ว มีประสิทธิภาพ และเชื่อถือได้แก่ผู้ใช้ โปรด ดาวน์โหลด JAR ของ API หรือเพียงเพิ่มการกำหนดค่า pom.xml ต่อไปนี้ในแอปพลิเคชัน Java ที่ใช้ Maven

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

การแปลง PDF เป็น HTML โดยใช้ Java

เราสามารถแปลงเอกสาร PDF เป็นเว็บเพจ HTML ได้อย่างง่ายดายโดยทางโปรแกรมโดยทำตามขั้นตอนง่ายๆ ที่ระบุด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  3. จากนั้นเลือกตั้งค่าตัวเลือกการแปลงต่างๆ เช่น FixLayout, FixLayoutShowBorders เป็นต้น
  4. สุดท้าย แปลง PDF เป็น HTML โดยใช้วิธี Converter.Convert() ใช้เส้นทางไฟล์เอาต์พุตและแปลงตัวเลือกเป็นอาร์กิวเมนต์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF เป็นเว็บเพจ HTML โดยใช้ Java

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลงเอกสาร PDF เป็นไฟล์ HTML
// เริ่มต้นการแปลงวัตถุคลาส
แปลงer converter = new แปลงer("C:\\Files\\Conversion\\sample.pdf");

// กำหนดตัวเลือกการแปลง
MarkupแปลงOptions options = new MarkupแปลงOptions();
options.setFixedLayout(true);

// แปลง
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
การแปลง PDF เป็น HTML โดยใช้ Java

การแปลง PDF เป็น HTML โดยใช้ Java

แปลงช่วงของหน้าจาก PDF เป็น HTML

เราสามารถแปลงช่วงหน้าของเอกสาร PDF เป็น HTML ได้โดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  3. จากนั้นตั้งค่าหมายเลขหน้าเพื่อเริ่มการแปลง
  4. หลังจากนั้นให้ตั้งค่าจำนวนหน้าเพื่อแปลงจำนวนหน้าทั้งหมด
  5. สุดท้าย แปลง PDF เป็น HTML โดยใช้วิธี Converter.Convert()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงช่วงของหน้าจากเอกสาร PDF ไปเป็นไฟล์ HTML โดยใช้ Java

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลงช่วงของหน้า PDF เป็นไฟล์ HTML
// เริ่มต้นการแปลงวัตถุคลาส
แปลงer converter = new แปลงer("C:\\Files\\Conversion\\sample.pdf");

// กำหนดตัวเลือกการแปลง
MarkupแปลงOptions options = new MarkupแปลงOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// แปลง
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

แปลงหน้าเฉพาะของ PDF เป็น HTML

เราสามารถแปลงหน้าเฉพาะของเอกสาร PDF เป็น HTML ได้โดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter
  2. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  3. จากนั้น ระบุหมายเลขหน้าเฉพาะในรายการที่คั่นด้วยเครื่องหมายจุลภาคเพื่อทำการแปลง
  4. สุดท้าย แปลง PDF เป็น HTML โดยใช้วิธี Converter.Convert()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงหน้าเฉพาะของเอกสาร PDF เป็นไฟล์ HTML โดยใช้ Java

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลงหน้าเฉพาะของเอกสาร PDF เป็นไฟล์ HTML
// เริ่มต้นการแปลงวัตถุคลาส
แปลงer converter = new แปลงer("C:\\Files\\Conversion\\sample.pdf");

// กำหนดตัวเลือกการแปลง
MarkupแปลงOptions options = new MarkupแปลงOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// แปลง
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

แปลง PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML ในภาษา Java

นอกจากนี้เรายังสามารถแปลงเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านเป็นหน้าเว็บ HTML ได้โดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก ให้ระบุรหัสผ่านโดยใช้อ็อบเจ็กต์คลาส PdfLoadOptions
  2. จากนั้น โหลดเอกสาร PDF โดยใช้คลาส Converter พร้อมด้วย PdfLoadOptions
  3. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  4. สุดท้าย แปลง PDF เป็น HTML โดยใช้วิธี Converter.Convert()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF ที่ป้องกันด้วยรหัสผ่านเป็นเอกสาร HTML โดยใช้ Java

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลง PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML
// กำหนดตัวเลือกการโหลด
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// เริ่มต้นการแปลงวัตถุคลาส
แปลงer converter = new แปลงer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// กำหนดตัวเลือกการแปลง
MarkupแปลงOptions options = new MarkupแปลงOptions();

// แปลง
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

การแปลง PDF เป็น HTML พร้อมลายน้ำใน Java

เราสามารถแปลงเอกสาร PDF เป็นหน้าเว็บ HTML และเพิ่มลายน้ำลงในไฟล์ HTML ที่แปลงแล้วโดยทำตามขั้นตอนด้านล่าง:

  1. ขั้นแรก โหลดเอกสาร PDF โดยใช้คลาส Converter
  2. จากนั้น สร้างอินสแตนซ์ของคลาส WatermarkOptions
  3. จากนั้นตั้งค่าตัวเลือกต่างๆ เช่น ข้อความ สี ความกว้าง ความสูง แบบอักษร ฯลฯ
  4. จากนั้น สร้างอินสแตนซ์ของคลาส MarkupConvertOptions
  5. หลังจากนั้นให้กำหนด WatermarkOptions ให้กับ MarkupConvertOptions
  6. สุดท้าย แปลง PDF เป็น HTML โดยใช้วิธี Converter.Convert()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF เป็นเอกสาร HTML ที่มีลายน้ำ

// ตัวอย่างโค้ดนี้สาธิตวิธีการแปลง PDF เป็น HTML ด้วยลายน้ำ
// เริ่มต้นการแปลงวัตถุคลาส
แปลงer converter = new แปลงer("C:\\Files\\Conversion\\sample.pdf");

// กำหนดลายน้ำ 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// กำหนดตัวเลือกการแปลง
MarkupแปลงOptions options = new MarkupแปลงOptions();
options.setWatermark(watermark);

// เส้นทางไฟล์เอาต์พุต
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// แปลง
converter.convert(outputFile, options);
การแปลง PDF เป็น HTML พร้อมลายน้ำใน Java

การแปลง PDF เป็น HTML พร้อมลายน้ำใน Java

รับใบอนุญาตฟรี

โปรดลองใช้ API โดยไม่มีข้อจำกัดในการประเมินโดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ เราได้เรียนรู้วิธีแปลงเอกสาร PDF เป็นเว็บเพจ HTML ใน Java นอกจากนี้เรายังได้เห็นวิธีการแปลงไฟล์ PDF ที่ป้องกันด้วยรหัสผ่านเป็น HTML และเพิ่มลายน้ำให้กับไฟล์ที่แปลงโดยทางโปรแกรม นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Conversion สำหรับ Java API ได้โดยใช้ เอกสารประกอบ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราที่ ฟอรั่ม

ดูสิ่งนี้ด้วย