
Преобразование HTML в Word с помощью Java
В этом сообщении блога вы узнаете, как программно преобразовать HTML в Word с помощью Java. К счастью, эта библиотека Java предлагает мгновенную обработку файлов, манипулирование ими и преобразование. Вы можете легко установить эту библиотеку без каких-либо внешних зависимостей. Кроме того, имеется исчерпывающая документация по его установке и использованию. Документы Microsoft Word являются наиболее широко используемыми форматами файлов в настоящее время. Поэтому мы шаг за шагом продемонстрируем процесс преобразования HTML в Word.
Мы рассмотрим следующие моменты:
- Преобразование HTML в Word с помощью Java — установка API
- Как программно конвертировать WebPage в Word
- Библиотека конвертера HTML в Word — расширенные функции
Преобразование HTML в Word с помощью Java — установка API
Эта библиотека Java DOCX предоставляет огромный набор функций, ускоряющих процессы преобразования файлов. Это дает вам контроль над задачами манипулирования данными и файлами. Чтобы включить эту библиотеку в свое Java-приложение, скачать jar-файлы или выполнить следующие настройки Maven.
Репозиторий
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Зависимость
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Как программно конвертировать WebPage в Word
Программное преобразование HTML-страницы в документ Word очень просто. Вы можете добиться этой функциональности, выполнив пару шагов, упомянутых ниже.
- Создайте экземпляр класса Document и загрузите исходный файл HTML.
- Вызовите метод save(java.lang.String fileName, int saveFormat), чтобы сохранить файл в формате DOCX.
Скопируйте и вставьте следующий код в свой файл Java, чтобы преобразовать файл HTML в файл Word.
// создать экземпляр класса Document и загрузить исходный файл HTML
Document document = new Document("index.html");
// вызвать метод save(java.lang.String fileName, int saveFormat) для сохранения файла в формате DOCX
document.save("output.docx", SaveFormat.DOCX);
Библиотека конвертера HTML в Word — расширенные возможности
В этом разделе мы рассмотрим расширенные функции, такие как настройка качества документа, установка пароля и многое другое.
Вы можете выполнить следующие шаги и фрагменты кода, чтобы узнать о дальнейших методах:
- Создайте экземпляр класса Document и загрузите исходный файл HTML.
- Метод protect(int type, java.lang.String password) позволит вам установить пароль для защиты документа от любых изменений.
- unprotect() удалит пароль.
- Установите этот метод setTrackRevisions в значение True, если изменения отслеживаются при редактировании этого документа в Microsoft Word.
- Орфографические ошибки будут выделены, если метод setShowSpellingErrors имеет значение True.
- Метод setShowGrammaticalErrors будет выделять грамматические ошибки, если он равен True.
- removeAllChildren удаляет все дочерние узлы текущего узла.
- Создайте экземпляр класса DocSaveOptions.
- Вызовите метод setUseHighQualityRendering, чтобы установить значение, определяющее, следует ли использовать высококачественные (то есть медленные) алгоритмы рендеринга.
- Вызовите метод save(java.lang.String fileName, int saveFormat), чтобы сохранить файл в формате DOCX.
// создать экземпляр класса Document и загрузить исходный файл HTML
Document document = new Document("index.html");
// Метод protect(int type, java.lang.String password) позволит вам установить пароль для защиты документа от любых изменений.
document.protect(1,"password");
// unprotect() удалит пароль
document.unprotect();
// установите этот метод setTrackRevisions в значение True, если изменения отслеживаются при редактировании этого документа в Microsoft Word.
document.setTrackRevisions(true);
// орфографические ошибки будут выделены, если метод setShowSpellingErrors имеет значение True
document.setShowSpellingErrors(true);
// Метод setShowGrammaticalErrors выделит грамматические ошибки, если True
document.setShowGrammaticalErrors(true);
// removeAllChildren удаляет все дочерние узлы текущего узла.
document.removeAllChildren();
// создать экземпляр класса DocSaveOptions
DocSaveOptions opt = new DocSaveOptions();
// вызовите метод setUseHighQualityRendering, чтобы установить значение, определяющее, следует ли использовать алгоритмы высококачественного (т.е. медленного) рендеринга.
opt.setUseHighQualityRendering(true);
// вызвать метод save(java.lang.String fileName, int saveFormat) для сохранения файла в формате DOCX
document.save("output.docx", SaveFormat.DOCX);
Получить бесплатную лицензию
Вы можете получить бесплатную временную лицензию, чтобы попробовать API без ограничений пробной версии.
Подведение итогов
Это подводит нас к концу этого сообщения в блоге. Мы рассмотрели, как программно преобразовать HTML в Word с помощью Java. Кроме того, вы можете найти фрагменты кода функций, упомянутых в предыдущих разделах. Кроме того, вы можете посетить документацию, чтобы узнать о других функциях, которые могут быть полезны для конвертера HTML в Word. Наконец, conholdate.com пишет новые сообщения в блоге на другие темы. Поэтому, пожалуйста, оставайтесь на связи для регулярных обновлений.
Задайте вопрос
Вы можете поделиться своими вопросами или запросами на нашем форуме.