Преобразование Word в HTML на Java

Преобразование Word в HTML на Java

Этот пост в блоге для вас, если вы хотите разработать конвертер Word в HTML для своего бизнес-приложения. Вы можете установить эту библиотеку Java Word для преобразования файлов Docx в другие популярные форматы, такие как HTML, PNG, PDF и другие. Однако к концу этого руководства вы должны хорошо знать эту библиотеку Java для преобразования файлов. Поэтому давайте начнем статью и узнаем, как конвертировать Word в HTML на Java программно.

Будут затронуты следующие моменты:

Установка библиотеки Java Word

Процесс установки этой библиотеки очень удобен для разработчиков, поскольку вы найдете исчерпывающую документацию по разработке и установке. Итак, вы можете скачать файл JAR или установить эту библиотеку, используя следующие конфигурации Maven.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Преобразование Word в HTML на Java

Все готово для написания исходного кода в вашем Java-приложении для программной сборки конвертера Word в HTML.

Ниже приведены шаги для преобразования Word в HTML:

  1. Создайте экземпляр класса Document и загрузите исходный файл Word.
  2. Инициализируйте объект класса HtmlSaveOptions, чтобы указать дополнительные параметры при сохранении документа в формате HTML.
  3. Вызовите setExportRoundtripInformation, чтобы указать, следует ли записывать информацию о пути туда и обратно при сохранении в HTML.
  4. Если значение метода setExportFontResources равно true, ресурсы шрифта будут экспортированы в HTML.
  5. Вызовите метод setExportFontsAsBase64, чтобы указать, следует ли встраивать ресурсы шрифта в HTML в кодировке Base64.
  6. Теперь метод save сохранит документ Word в формате HTML.

Скопируйте и вставьте следующий код в основной файл:

// Создайте экземпляр класса Document и загрузите исходный файл Word. 
Document doc = new Document(  "sample.doc");
// Инициализируйте объект класса HtmlSaveOptions, чтобы указать дополнительные параметры при сохранении документа в формате HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Вызовите setExportRoundtripInformation, чтобы указать, следует ли записывать информацию о циклическом обходе при сохранении в HTML.
options.setExportRoundtripInformation(true);
// Если значение метода setExportFontResources равно true, ресурсы шрифта будут экспортированы в HTML.
options.setExportFontResources(true);
// Вызовите метод setExportFontsAsBase64, чтобы указать, следует ли встраивать ресурсы шрифтов в HTML в кодировке Base64.
options.setExportFontsAsBase64(true);
// Теперь метод сохранения сохранит документ Word в формате HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

Результат можно увидеть на изображении ниже:

слово в html

Получить бесплатную лицензию

Вы можете воспользоваться бесплатной временной лицензией, чтобы опробовать API без ограничений пробной версии.

Подведение итогов

Мы можем закончить этот пост в блоге здесь. Надеюсь, вам понравилась статья, и вы узнали, как программно конвертировать Word в HTML на Java. Эта библиотека Java Word предоставляет множество других возможностей, поэтому не забудьте посетить документацию.

Кроме того, мы рекомендуем вам следовать нашему Руководству по началу работы.

Наконец, conholdate.com пишет новые сообщения в блоге. Так что, пожалуйста, оставайтесь на связи для регулярных обновлений.

Задайте вопрос

Вы можете сообщить нам о своих вопросах или запросах на нашем форуме.

Часто задаваемые вопросы

Как преобразовать DOCX в HTML?

Создайте экземпляр класса Document и загрузите исходный файл Word и вызовите метод save, чтобы сохранить файл Word в формате HTML.

Смотрите также