تبدیل HTML به ورد با استفاده از جاوا

HTML را با استفاده از Java به ورد تبدیل کنید

این پست وبلاگ به شما می‌آموزد که چگونه HTML را به Word DOC یا DOCX به‌طور برنامه‌نویسی با استفاده از Java تبدیل کنید. خوشبختانه، این کتابخانه جاوا پردازش، دستکاری و تبدیل فایل را به‌صورت آنی ارائه می‌دهد. می‌توانید این کتابخانه را به‌راحتی بدون هیچ وابستگی خارجی نصب کنید. علاوه بر این، مستندات جامعی در مورد نصب و استفاده از آن موجود است. اسناد مایکروسافت ورد محبوب‌ترین فرمت‌های فایل در زمان کنونی هستند. بنابراین، ما فرآیند تبدیل یک صفحه وب یا وب‌سایت HTML به Word را گام به گام نشان خواهیم داد.

ما به پوشش نقاط زیر خواهیم پرداخت:

تبدیل HTML به DOCX ورد با استفاده از Java - نصب API

این Java DOCX library مجموعه بزرگی از ویژگی‌ها را ارائه می‌دهد که فرایندهای تبدیل فایل را بهبود می‌بخشد. این به شما کنترل بر وظایف دستکاری داده و فایل را می‌دهد. برای فعال‌سازی این کتابخانه در برنامه Java خود، download فایل‌های jar را دانلود کنید یا می‌توانید از پیکربندی‌های Maven زیر پیروی کنید.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

وابستگی

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

چگونه وب‌سایت را به صورت برنامه‌نویسی در Java به Word DOCX یا DOC تبدیل کنیم

تبدیل یک صفحه HTML به یک سند Word به صورت برنامه‌نویسی بسیار ساده است. شما می‌توانید با دنبال کردن چند مرحله ذکر شده در زیر، این قابلیت را بدست آورید.

  1. یک نمونه از کلاس Document ایجاد کنید و یک فایل HTML منبع را بارگذاری کنید.
  2. متد save(java.lang.String fileName, int saveFormat) را برای ذخیره فایل در فرمت DOCX فراخوانی کنید.

کپی و چسباندن کد زیر را در فایل Java خود انجام دهید تا یک فایل HTML را به یک فایل Word DOCX با استفاده از Java تبدیل کنید.

// یک نمونه از کلاس Document ایجاد کنید و یک فایل HTML منبع را بارگذاری کنید.
Document document = new Document("index.html");
// متد call save(java.lang.String fileName, int saveFormat) را برای ذخیره فایل در فرمت DOCX فراخوانی کنید.
document.save("output.docx", SaveFormat.DOCX);

کتابخانه تبدیل HTML به سند ورد Java - ویژگی‌های پیشرفته

در این بخش، ویژگی‌های پیشرفته‌ای مانند تنظیم کیفیت سند، تنظیم رمز عبور و موارد دیگر را بررسی خواهیم کرد.

شما می‌توانید از مراحل زیر و قطعه‌های کد برای یادگیری درباره روش‌های بیشتر استفاده کنید:

  1. یک نمونه از کلاس Document ایجاد کنید و یک فایل HTML منبع را بارگذاری کنید.
  2. متد protect(int type, java.lang.String password) به شما این امکان را می‌دهد که یک رمز عبور برای محافظت از سند در برابر هرگونه تغییر تنظیم کنید.
  3. unprotect() رمز عبور را حذف خواهد کرد.
  4. این روش setTrackRevisions را به True تنظیم کنید اگر تغییرات هنگام ویرایش این سند در Microsoft Word ردیابی شود.
  5. اشکالات املایی در صورتی که متد setShowSpellingErrors درست باشد، برجسته خواهند شد.
  6. setShowGrammaticalErrors متد خطاهای دستوری را در صورت درست بودن ، هایلایت می کند.
  7. removeAllChildren تمام نودهای فرزند نود فعلی را حذف می‌کند.
  8. نمونه‌ای از کلاس DocSaveOptions را ایجاد کنید.
  9. متد setUseHighQualityRendering را فراخوانی کنید تا مقداری را تعیین کنید که آیا باید از الگوریتم‌های رندرینگ با کیفیت بالا (یعنی کند) استفاده شود یا خیر.
  10. متد save(java.lang.String fileName, int saveFormat) را برای ذخیره فایل به فرمت DOCX فراخوانی کنید.

کد نمونه زیر نشان می‌دهد که چگونه می‌توان HTML را با استفاده از Java به سند Word DOCX با گزینه‌های پیشرفته تبدیل کرد:

        // یک نمونه از کلاس Document ایجاد کنید و یک فایل HTML منبع را بارگذاری کنید.
        Document document = new Document("index.html");
        // متد protect(int type, java.lang.String password) به شما این امکان را می‌دهد که یک رمز عبور برای محافظت از سند در برابر هرگونه تغییرات تنظیم کنید.
        document.protect(1,"password");
        // unprotect() رمز عبور را حذف خواهد کرد
        document.unprotect();
        // این متد setTrackRevisions را به True تنظیم کنید اگر تغییرات هنگام ویرایش این سند در Microsoft Word پیگیری شود.
        document.setTrackRevisions(true);
        // اشتباهات املایی در صورتی که متد setShowSpellingErrors برابر با True باشد، هایلایت خواهند شد.
        document.setShowSpellingErrors(true);
        // متد setShowGrammaticalErrors خطاهای گرامری را در صورت درست بودن برجسته خواهد کرد
        document.setShowGrammaticalErrors(true);
        // removeAllChildren تمام نودهای فرزند نود فعلی را حذف می‌کند.
        document.removeAllChildren();
        // یک نمونه از کلاس DocSaveOptions را ایجاد کنید
        DocSaveOptions opt = new DocSaveOptions();
        // متد setUseHighQualityRendering را فراخوانی کنید تا مقداری را تعیین کنید که آیا از الگوریتم‌های رندر با کیفیت بالا (یعنی کند) استفاده شود یا خیر.
        opt.setUseHighQualityRendering(true);
        // متد call save(java.lang.String fileName, int saveFormat) را برای ذخیره فایل در فرمت DOCX فراخوانی کنید.
        document.save("output.docx", SaveFormat.DOCX);

مجوز رایگان بگیرید

شما می‌توانید یک مجوز موقت رایگان برای امتحان API بدون محدودیت‌های ارزیابی دریافت کنید.

جمع بندی

این ما را به پایان این پست وبلاگ می‌رساند. ما نحوه تبدیل HTML به Word DOCX با استفاده از Java را پوشش دادیم. علاوه بر این، می‌توانید مراحل و کدهای مربوط به این قابلیت را در بخش‌های بالا پیدا کنید. همچنین، می‌توانید به documentation برای سایر ویژگی‌هایی که می‌تواند برای تبدیل HTML به Word DOCX شما مفید باشد، مراجعه کنید. در نهایت، conholdate.com در حال نوشتن پست‌های جدید وبلاگ در موضوعات دیگر است. بنابراین لطفاً برای به‌روزرسانی‌های منظم در تماس باشید.

سوالی بپرسید

شما می‌توانید سوالات یا پرسش‌های خود را در forum به اشتراک بگذارید.

همچنین ببینید