แปลง Word เป็น HTML ใน Java

แปลง Word เป็น HTML ใน Java

โพสต์ในบล็อกนี้เหมาะสำหรับคุณหากคุณต้องการพัฒนาตัวแปลง Word เป็น HTML สำหรับแอปพลิเคชันธุรกิจของคุณ คุณสามารถติดตั้ง Java Word library เพื่อแปลงไฟล์ Docx เป็นรูปแบบยอดนิยมอื่น ๆ เช่น HTML, PNG, PDF และอื่น ๆ อย่างไรก็ตาม ในตอนท้ายของบทช่วยสอนนี้ คุณควรมีความรู้ที่ดีเกี่ยวกับไลบรารี Java การแปลงไฟล์นี้ ดังนั้นเรามาเริ่มบทความและเรียนรู้วิธีแปลง Word เป็น HTML ใน Java โดยทางโปรแกรม

ประเด็นต่อไปนี้จะครอบคลุม:

การติดตั้งไลบรารี Java Word

กระบวนการติดตั้งไลบรารีนี้เป็นมิตรกับนักพัฒนามาก เนื่องจากคุณจะพบเอกสารที่ครอบคลุมเกี่ยวกับการพัฒนาและการติดตั้ง ดังนั้น คุณสามารถ ดาวน์โหลดไฟล์ ไฟล์ JAR หรือติดตั้งไลบรารีนี้โดยใช้การกำหนดค่า Maven ต่อไปนี้

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

แปลง Word เป็น HTML ใน Java

คุณพร้อมแล้วสำหรับการเขียนซอร์สโค้ดในแอปพลิเคชัน Java ของคุณเพื่อสร้างตัวแปลง Word เป็น HTML โดยทางโปรแกรม

ต่อไปนี้เป็นขั้นตอนในการแปลง Word เป็น HTML:

  1. สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ Word ต้นฉบับ
  2. เริ่มต้นออบเจ็กต์ของคลาส HtmlSaveOptions เพื่อระบุตัวเลือกเพิ่มเติมเมื่อบันทึกเอกสารเป็นรูปแบบ HTML
  3. เรียกใช้ setExportRoundtripInformation เพื่อระบุว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML หรือไม่
  4. หากค่าของเมธอด setExportFontResources เป็นจริง ทรัพยากรแบบอักษรจะถูกส่งออกเป็น HTML
  5. เรียกใช้เมธอด setExportFontsAsBase64 เพื่อระบุว่าควรฝังทรัพยากรแบบอักษรใน HTML ในการเข้ารหัส Base64 หรือไม่
  6. ตอนนี้วิธี save จะบันทึกเอกสาร Word ในรูปแบบ HTML

คัดลอกและวางโค้ดต่อไปนี้ลงในไฟล์หลักของคุณ:

// สร้างอินสแตนซ์ของคลาสเอกสารและโหลดไฟล์ Word ต้นฉบับ 
Document doc = new Document(  "sample.doc");
// เตรียมใช้งานออบเจ็กต์ของคลาส HtmlSaveOptions เพื่อระบุตัวเลือกเพิ่มเติมเมื่อบันทึกเอกสารเป็นรูปแบบ HTML  
HtmlSaveOptions options = new HtmlSaveOptions();
// เรียกใช้ setExportRoundtripInformation เพื่อระบุว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML หรือไม่
options.setExportRoundtripInformation(true);
// หากค่าของเมธอด setExportFontResources เป็นจริง ทรัพยากรแบบอักษรจะถูกส่งออกเป็น HTML
options.setExportFontResources(true);
// เรียกใช้เมธอด setExportFontsAsBase64 เพื่อระบุว่าควรฝังทรัพยากรแบบอักษรลงใน HTML ในการเข้ารหัส Base64 หรือไม่
options.setExportFontsAsBase64(true);
// ตอนนี้วิธีการบันทึกจะบันทึกเอกสาร Word ในรูปแบบ HTML  
doc.save("Document_out.html", SaveFormat.HTML);

ผลลัพธ์สามารถดูได้ในภาพด้านล่าง:

คำเป็น html

รับใบอนุญาตฟรี

คุณสามารถใช้ ใบอนุญาตชั่วคราวฟรี เพื่อทดลองใช้ API โดยไม่มีข้อจำกัดในการประเมิน

สรุป

เราสามารถจบการโพสต์บล็อกนี้ได้ที่นี่ หวังว่าคุณจะเพลิดเพลินกับบทความนี้และได้เรียนรู้วิธีแปลง Word เป็น HTML ใน Java โดยทางโปรแกรมแล้ว มีคุณสมบัติอื่นๆ อีกมากมายที่เปิดเผยโดยไลบรารี Java Word นี้ ดังนั้นอย่าลืมไปที่ เอกสารประกอบ

นอกจากนี้ เราขอแนะนำให้คุณปฏิบัติตาม คู่มือการเริ่มต้นใช้งาน

สุดท้ายนี้ conholdate.com กำลังเขียนบล็อกโพสต์ใหม่ ดังนั้นโปรดติดต่อเพื่อรับการอัปเดตเป็นประจำ

ถามคำถาม

คุณสามารถแจ้งให้เราทราบเกี่ยวกับคำถามหรือข้อสงสัยของคุณได้ใน ฟอรั่ม

คำถามที่พบบ่อย

ฉันจะแปลง DOCX เป็น HTML ได้อย่างไร

สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ Word ต้นฉบับ จากนั้นเรียกใช้เมธอด save เพื่อบันทึกไฟล์ Word ในรูปแบบ HTML

ดูสิ่งนี้ด้วย