تبدیل پرونده Word DOCX به HTML در جاوا

Word را به HTML در Java تبدیل کنید

این پست وبلاگ برای شماست اگر می‌خواهید یک Word مبدل صفحه وب DOCX به HTML برای برنامه کسب‌وکار خود توسعه دهید. شما می‌توانید این library Java را نصب کنید تا فایل‌های Docx را به فرمت‌های محبوب دیگر مانند HTML، PNG، PDF و غیره تبدیل کنید. با این حال، تا پایان این آموزش، شما باید دانش خوبی از این کتابخانه تبدیل فایل Java داشته باشید. بنابراین، بیایید مقاله را شروع کنیم و یاد بگیریم چگونه ورد را به HTML به صورت برنامه‌نویسی در Java تبدیل کنیم.

نکات زیر بررسی خواهد شد:

نصب کتابخانه تبدیل DOCX به Word Java

فرآیند نصب این کتابخانه بسیار کاربرپسند است زیرا شما می‌توانید مستندات جامع مربوط به توسعه و نصب را بیابید. بنابراین، می‌توانید download فایل JAR را دریافت کرده یا این کتابخانه را با استفاده از تنظیمات Maven زیر نصب کنید.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

تبدیل DOCX ورد به HTML در Java

شما برای نوشتن کد منبع در برنامه کاربردی Java خود برای ساخت برنامه‌ای که به‌صورت برنامه‌نویسی Word را به HTML تبدیل کند، آماده‌اید.

به دنبال مراحل تبدیل Word به HTML در Java هستید:

  1. یک نمونه از کلاس Document ایجاد کنید و فایل ورد منبع را بارگذاری کنید.
  2. یک شی از کلاس HtmlSaveOptions را برای مشخص کردن گزینه‌های اضافی هنگام ذخیره‌سازی یک سند به فرمت‌های HTML راه‌اندازی کنید.
  3. Invoke the setExportRoundtripInformation to specify whether to write the roundtrip information when saving to HTML.
  4. اگر مقدار متد setExportFontResources درست باشد، منابع فونت به HTML صادر خواهند شد.
  5. متد setExportFontsAsBase64 را فراخوانی کنید تا مشخص کنید آیا منابع فونت باید در HTML با کدگذاری Base64 گنجانده شوند.
  6. حالا، متد save سند ورد را در فرمت HTML ذخیره خواهد کرد.

کد زیر را در فایل اصلی خود کپی و جای‌گذاری کنید تا سند DOCX به صفحه وب HTML در Java تبدیل شود:

// یک نمونه از کلاس Document ایجاد کرده و فایل Word منبع را بارگذاری کنید. 
Document doc = new Document(  "sample.doc");
// یک شی از کلاس HtmlSaveOptions را برای مشخص کردن گزینه‌های اضافی هنگام ذخیره اسناد در قالب‌های HTML مقداردهی اولیه کنید.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Invoke the setExportRoundtripInformation to specify whether to write the roundtrip information when saving to HTML.
options.setExportRoundtripInformation(true);
// اگر مقدار متد setExportFontResources برابر با true باشد، منابع فونت به HTML صادر خواهند شد.
options.setExportFontResources(true);
// متد setExportFontsAsBase64 را فراخوانی کنید تا مشخص کنید که آیا منابع قلم باید به HTML با کدگذاری Base64 گنجانده شوند یا خیر.
options.setExportFontsAsBase64(true);
// حال، متد save سند Word را در فرمت HTML ذخیره خواهد کرد.  
doc.save("Document_out.html", SaveFormat.HTML);

خروجی را می‌توان در تصویر زیر مشاهده کرد:

word DOCX to html java

یک مجوز رایگان دریافت کنید

شما می‌توانید از free temporary license برای امتحان کردن API بدون محدودیت‌های ارزیابی استفاده کنید.

خلاصه کردن

ما می‌توانیم این پست وبلاگ را اینجا به پایان برسانیم. امیدواریم شما از مقاله لذت برده‌اید و یاد گرفته‌اید که چگونه فایل‌های Word DOCX را به‌صورت برنامه‌نویسی در Java به HTML تبدیل کنید. ویژگی‌های دیگری نیز توسط این کتابخانه Word Java ارائه شده است، پس فراموش نکنید که به documentation سر بزنید.

علاوه بر این، پیشنهاد می‌کنیم که راهنمای Getting Started guide ما را دنبال کنید.

در نهایت، conholdate.com در حال نوشتن پست‌های وبلاگ جدید است. پس لطفاً برای دریافت به‌روزرسانی‌های منظم در ارتباط باشید.

Ask a question

شما می‌توانید ما را از سوالات یا پرسش‌های خود در forum مطلع کنید.

سوالات متداول

How do I convert a DOCX to HTML?

یک نمونه از کلاس Document ایجاد کنید، فایل Word منبع را بارگذاری کنید و متد save را برای ذخیره فایل DOCX ورد در فرمت HTML فراخوانی کنید.

همچنین ببینید