
แปลง Word เป็น HTML ใน Java
โพสต์ในบล็อกนี้เหมาะสำหรับคุณหากคุณต้องการพัฒนาตัวแปลง Word เป็น HTML สำหรับแอปพลิเคชันธุรกิจของคุณ คุณสามารถติดตั้ง Java Word library เพื่อแปลงไฟล์ Docx เป็นรูปแบบยอดนิยมอื่น ๆ เช่น HTML, PNG, PDF และอื่น ๆ อย่างไรก็ตาม ในตอนท้ายของบทช่วยสอนนี้ คุณควรมีความรู้ที่ดีเกี่ยวกับไลบรารี Java การแปลงไฟล์นี้ ดังนั้นเรามาเริ่มบทความและเรียนรู้วิธีแปลง Word เป็น HTML ใน Java โดยทางโปรแกรม
ประเด็นต่อไปนี้จะครอบคลุม:
การติดตั้งไลบรารี Java Word
กระบวนการติดตั้งไลบรารีนี้เป็นมิตรกับนักพัฒนามาก เนื่องจากคุณจะพบเอกสารที่ครอบคลุมเกี่ยวกับการพัฒนาและการติดตั้ง ดังนั้น คุณสามารถ ดาวน์โหลดไฟล์ ไฟล์ JAR หรือติดตั้งไลบรารีนี้โดยใช้การกำหนดค่า Maven ต่อไปนี้
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.10</version>
<classifier>jdk17</classifier>
</dependency>
แปลง Word เป็น HTML ใน Java
คุณพร้อมแล้วสำหรับการเขียนซอร์สโค้ดในแอปพลิเคชัน Java ของคุณเพื่อสร้างตัวแปลง Word เป็น HTML โดยทางโปรแกรม
ต่อไปนี้เป็นขั้นตอนในการแปลง Word เป็น HTML:
- สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ Word ต้นฉบับ
- เริ่มต้นออบเจ็กต์ของคลาส HtmlSaveOptions เพื่อระบุตัวเลือกเพิ่มเติมเมื่อบันทึกเอกสารเป็นรูปแบบ HTML
- เรียกใช้ setExportRoundtripInformation เพื่อระบุว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML หรือไม่
- หากค่าของเมธอด setExportFontResources เป็นจริง ทรัพยากรแบบอักษรจะถูกส่งออกเป็น HTML
- เรียกใช้เมธอด setExportFontsAsBase64 เพื่อระบุว่าควรฝังทรัพยากรแบบอักษรใน HTML ในการเข้ารหัส Base64 หรือไม่
- ตอนนี้วิธี save จะบันทึกเอกสาร Word ในรูปแบบ HTML
คัดลอกและวางโค้ดต่อไปนี้ลงในไฟล์หลักของคุณ:
// สร้างอินสแตนซ์ของคลาสเอกสารและโหลดไฟล์ Word ต้นฉบับ
Document doc = new Document( "sample.doc");
// เตรียมใช้งานออบเจ็กต์ของคลาส HtmlSaveOptions เพื่อระบุตัวเลือกเพิ่มเติมเมื่อบันทึกเอกสารเป็นรูปแบบ HTML
HtmlSaveOptions options = new HtmlSaveOptions();
// เรียกใช้ setExportRoundtripInformation เพื่อระบุว่าจะเขียนข้อมูลไปกลับเมื่อบันทึกเป็น HTML หรือไม่
options.setExportRoundtripInformation(true);
// หากค่าของเมธอด setExportFontResources เป็นจริง ทรัพยากรแบบอักษรจะถูกส่งออกเป็น HTML
options.setExportFontResources(true);
// เรียกใช้เมธอด setExportFontsAsBase64 เพื่อระบุว่าควรฝังทรัพยากรแบบอักษรลงใน HTML ในการเข้ารหัส Base64 หรือไม่
options.setExportFontsAsBase64(true);
// ตอนนี้วิธีการบันทึกจะบันทึกเอกสาร Word ในรูปแบบ HTML
doc.save("Document_out.html", SaveFormat.HTML);
ผลลัพธ์สามารถดูได้ในภาพด้านล่าง:

รับใบอนุญาตฟรี
คุณสามารถใช้ ใบอนุญาตชั่วคราวฟรี เพื่อทดลองใช้ API โดยไม่มีข้อจำกัดในการประเมิน
สรุป
เราสามารถจบการโพสต์บล็อกนี้ได้ที่นี่ หวังว่าคุณจะเพลิดเพลินกับบทความนี้และได้เรียนรู้วิธีแปลง Word เป็น HTML ใน Java โดยทางโปรแกรมแล้ว มีคุณสมบัติอื่นๆ อีกมากมายที่เปิดเผยโดยไลบรารี Java Word นี้ ดังนั้นอย่าลืมไปที่ เอกสารประกอบ
นอกจากนี้ เราขอแนะนำให้คุณปฏิบัติตาม คู่มือการเริ่มต้นใช้งาน
สุดท้ายนี้ conholdate.com กำลังเขียนบล็อกโพสต์ใหม่ ดังนั้นโปรดติดต่อเพื่อรับการอัปเดตเป็นประจำ
ถามคำถาม
คุณสามารถแจ้งให้เราทราบเกี่ยวกับคำถามหรือข้อสงสัยของคุณได้ใน ฟอรั่ม
คำถามที่พบบ่อย
ฉันจะแปลง DOCX เป็น HTML ได้อย่างไร
สร้างอินสแตนซ์ของคลาส Document และโหลดไฟล์ Word ต้นฉบับ จากนั้นเรียกใช้เมธอด save เพื่อบันทึกไฟล์ Word ในรูปแบบ HTML