Преобразование HTML в Word с помощью Java

Преобразование HTML в Word с помощью Java

В этом сообщении блога вы узнаете, как программно преобразовать HTML в Word с помощью Java. К счастью, эта библиотека Java предлагает мгновенную обработку файлов, манипулирование ими и преобразование. Вы можете легко установить эту библиотеку без каких-либо внешних зависимостей. Кроме того, имеется исчерпывающая документация по его установке и использованию. Документы Microsoft Word являются наиболее широко используемыми форматами файлов в настоящее время. Поэтому мы шаг за шагом продемонстрируем процесс преобразования HTML в Word.

Мы рассмотрим следующие моменты:

Преобразование HTML в Word с помощью Java — установка API

Эта библиотека Java DOCX предоставляет огромный набор функций, ускоряющих процессы преобразования файлов. Это дает вам контроль над задачами манипулирования данными и файлами. Чтобы включить эту библиотеку в свое Java-приложение, скачать jar-файлы или выполнить следующие настройки Maven.

Репозиторий

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Зависимость

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Как программно конвертировать WebPage в Word

Программное преобразование HTML-страницы в документ Word очень просто. Вы можете добиться этой функциональности, выполнив пару шагов, упомянутых ниже.

  1. Создайте экземпляр класса Document и загрузите исходный файл HTML.
  2. Вызовите метод save(java.lang.String fileName, int saveFormat), чтобы сохранить файл в формате DOCX.

Скопируйте и вставьте следующий код в свой файл Java, чтобы преобразовать файл HTML в файл Word.

// создать экземпляр класса Document и загрузить исходный файл HTML
Document document = new Document("index.html");
// вызвать метод save(java.lang.String fileName, int saveFormat) для сохранения файла в формате DOCX
document.save("output.docx", SaveFormat.DOCX);

Библиотека конвертера HTML в Word — расширенные возможности

В этом разделе мы рассмотрим расширенные функции, такие как настройка качества документа, установка пароля и многое другое.

Вы можете выполнить следующие шаги и фрагменты кода, чтобы узнать о дальнейших методах:

  1. Создайте экземпляр класса Document и загрузите исходный файл HTML.
  2. Метод protect(int type, java.lang.String password) позволит вам установить пароль для защиты документа от любых изменений.
  3. unprotect() удалит пароль.
  4. Установите этот метод setTrackRevisions в значение True, если изменения отслеживаются при редактировании этого документа в Microsoft Word.
  5. Орфографические ошибки будут выделены, если метод setShowSpellingErrors имеет значение True.
  6. Метод setShowGrammaticalErrors будет выделять грамматические ошибки, если он равен True.
  7. removeAllChildren удаляет все дочерние узлы текущего узла.
  8. Создайте экземпляр класса DocSaveOptions.
  9. Вызовите метод setUseHighQualityRendering, чтобы установить значение, определяющее, следует ли использовать высококачественные (то есть медленные) алгоритмы рендеринга.
  10. Вызовите метод save(java.lang.String fileName, int saveFormat), чтобы сохранить файл в формате DOCX.
        // создать экземпляр класса Document и загрузить исходный файл HTML
        Document document = new Document("index.html");
        // Метод protect(int type, java.lang.String password) позволит вам установить пароль для защиты документа от любых изменений.
        document.protect(1,"password");
        // unprotect() удалит пароль
        document.unprotect();
        // установите этот метод setTrackRevisions в значение True, если изменения отслеживаются при редактировании этого документа в Microsoft Word.
        document.setTrackRevisions(true);
        // орфографические ошибки будут выделены, если метод setShowSpellingErrors имеет значение True
        document.setShowSpellingErrors(true);
        // Метод setShowGrammaticalErrors выделит грамматические ошибки, если True
        document.setShowGrammaticalErrors(true);
        // removeAllChildren удаляет все дочерние узлы текущего узла.
        document.removeAllChildren();
        // создать экземпляр класса DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // вызовите метод setUseHighQualityRendering, чтобы установить значение, определяющее, следует ли использовать алгоритмы высококачественного (т.е. медленного) рендеринга.
        opt.setUseHighQualityRendering(true);
        // вызвать метод save(java.lang.String fileName, int saveFormat) для сохранения файла в формате DOCX
        document.save("output.docx", SaveFormat.DOCX);

Получить бесплатную лицензию

Вы можете получить бесплатную временную лицензию, чтобы попробовать API без ограничений пробной версии.

Подведение итогов

Это подводит нас к концу этого сообщения в блоге. Мы рассмотрели, как программно преобразовать HTML в Word с помощью Java. Кроме того, вы можете найти фрагменты кода функций, упомянутых в предыдущих разделах. Кроме того, вы можете посетить документацию, чтобы узнать о других функциях, которые могут быть полезны для конвертера HTML в Word. Наконец, conholdate.com пишет новые сообщения в блоге на другие темы. Поэтому, пожалуйста, оставайтесь на связи для регулярных обновлений.

Задайте вопрос

Вы можете поделиться своими вопросами или запросами на нашем форуме.

Смотрите также