Convertir Word a HTML en Java

Convertir Word a HTML en Java

Esta publicación de blog es para usted si desea desarrollar un convertidor de Word a HTML para su aplicación comercial. Puede instalar esta biblioteca de Java Word para convertir archivos Docx a otros formatos populares como HTML, PNG, PDF y más. Sin embargo, al final de este tutorial, debe tener un buen conocimiento de esta biblioteca Java de conversión de archivos. Por lo tanto, comencemos el artículo y aprendamos cómo convertir Word a HTML en Java mediante programación.

Se tratarán los siguientes puntos:

Instalación de la biblioteca de Java Word

El proceso de instalación de esta biblioteca es muy fácil de usar para los desarrolladores, ya que encontrará documentación completa sobre el desarrollo y la instalación. Entonces, puede descargar el archivo JAR o instalar esta biblioteca usando las siguientes configuraciones de Maven.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Convertir Word a HTML en Java

Ya está todo listo para escribir el código fuente en su aplicación Java para crear un convertidor de Word a HTML mediante programación.

Los siguientes son los pasos para convertir Word a HTML:

  1. Cree una instancia de la clase Document y cargue el archivo fuente de Word.
  2. Inicialice un objeto de la clase HtmlSaveOptions para especificar opciones adicionales al guardar un documento en formato HTML.
  3. Invoque setExportRoundtripInformation para especificar si desea escribir la información de ida y vuelta al guardar en HTML.
  4. Si el valor del método setExportFontResources es verdadero, los recursos de fuente se exportarán a HTML.
  5. Llame al método setExportFontsAsBase64 para especificar si los recursos de fuentes se deben incrustar en HTML en la codificación Base64.
  6. Ahora, el método save guardará el documento de Word en formato HTML.

Copie y pegue el siguiente código en su archivo principal:

// Cree una instancia de la clase Document y cargue el archivo de Word de origen. 
Document doc = new Document(  "sample.doc");
// Inicialice un objeto de la clase HtmlSaveOptions para especificar opciones adicionales al guardar un documento en formatos HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Invoque setExportRoundtripInformation para especificar si se debe escribir la información de ida y vuelta al guardar en HTML.
options.setExportRoundtripInformation(true);
// Si el valor del método setExportFontResources es verdadero, los recursos de fuente se exportarán a HTML.
options.setExportFontResources(true);
// Llame al método setExportFontsAsBase64 para especificar si los recursos de fuentes se deben incrustar en HTML en codificación Base64.
options.setExportFontsAsBase64(true);
// Ahora, el método de guardar guardará el documento de Word en formato HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

La salida se puede ver en la siguiente imagen:

palabra a html

Obtenga una licencia gratis

Puede aprovechar una licencia temporal gratuita para probar la API sin limitaciones de evaluación.

Resumiendo

Podemos terminar esta publicación de blog aquí. Esperamos que haya disfrutado el artículo y haya aprendido cómo convertir Word a HTML en Java mediante programación. Hay muchas otras características expuestas por esta biblioteca de Java Word, así que no olvides visitar la documentación.

Además, le sugerimos que siga nuestra Guía de introducción.

Finalmente, conholdate.com está escribiendo nuevas publicaciones de blog. Por lo tanto, manténgase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Puede informarnos sobre sus preguntas o consultas en nuestro foro.

preguntas frecuentes

¿Cómo convierto un DOCX a HTML?

Cree una instancia de la clase Documento y cargue el archivo de Word de origen, y llame al método guardar para guardar el archivo de Word en formato HTML.

Ver también