Convertir HTML a Word usando Java

Convertir HTML a Word usando Java

Esta publicación de blog le enseñará cómo convertir HTML a Word usando Java mediante programación. Afortunadamente, esta biblioteca Java ofrece procesamiento, manipulación y conversión instantáneos de archivos. Puede instalar esta biblioteca fácilmente sin dependencias externas. Además, existe documentación completa disponible con respecto a su instalación y uso. Los documentos de Microsoft Word son los formatos de archivo más utilizados en la actualidad. Por lo tanto, demostraremos el proceso de conversión de HTML a Word paso a paso.

Cubriremos los siguientes puntos:

Convertir HTML a Word usando Java - Instalación de API

Esta biblioteca Java DOCX proporciona una gran cantidad de características que impulsan los procesos de conversión de archivos. Le da control sobre las tareas de manipulación de datos y archivos. Para habilitar esta biblioteca en su aplicación Java, descargue los archivos jar o puede seguir las siguientes configuraciones de Maven.

Repositorio

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dependencia

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Cómo convertir WebPage a Word programáticamente

Convertir una página HTML en un documento de Word mediante programación es muy simple. Puede lograr esta funcionalidad siguiendo un par de pasos que se mencionan a continuación.

  1. Cree una instancia de la clase Documento y cargue un archivo HTML fuente.
  2. Llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX.

Copie y pegue el siguiente código en su archivo Java para convertir un archivo HTML a un archivo de Word.

// cree una instancia de la clase Document y cargue un archivo HTML de origen
Document document = new Document("index.html");
// llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX
document.save("output.docx", SaveFormat.DOCX);

Biblioteca de conversión de HTML a Word - Funciones avanzadas

En esta sección, exploraremos las funciones avanzadas, como la configuración de la calidad del documento, la configuración de una contraseña y más.

Puede seguir los siguientes pasos y los fragmentos de código para conocer otros métodos:

  1. Cree una instancia de la clase Documento y cargue un archivo HTML fuente.
  2. El método protect(int type, java.lang.String password) le permitirá establecer una contraseña para proteger el documento de cualquier cambio.
  3. unprotect() eliminará la contraseña.
  4. Establezca este método setTrackRevisions en True si se realiza un seguimiento de los cambios cuando se edita este documento en Microsoft Word.
  5. Los errores ortográficos se resaltarán si el método setShowSpellingErrors es verdadero.
  6. El método setShowGrammicalErrors resaltará los errores gramaticales si es Verdadero.
  7. removeAllChildren elimina todos los nodos secundarios del nodo actual.
  8. Crea una instancia de la clase DocSaveOptions.
  9. Invoque el método setUseHighQualityRendering para establecer un valor que determine si usar o no algoritmos de renderizado de alta calidad (es decir, lento).
  10. Llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX.
        // cree una instancia de la clase Document y cargue un archivo HTML de origen
        Document document = new Document("index.html");
        // El método protect(int type, java.lang.String password) le permitirá establecer una contraseña para proteger el documento de cualquier cambio
        document.protect(1,"password");
        // unprotect() eliminará la contraseña
        document.unprotect();
        // establezca este método setTrackRevisions en True si se realiza un seguimiento de los cambios cuando se edita este documento en Microsoft Word.
        document.setTrackRevisions(true);
        // los errores ortográficos se resaltarán si el método setShowSpellingErrors es verdadero
        document.setShowSpellingErrors(true);
        // El método setShowGrammicalErrors resaltará los errores gramaticales si es True
        document.setShowGrammaticalErrors(true);
        // removeAllChildren elimina todos los nodos secundarios del nodo actual.
        document.removeAllChildren();
        // instanciar una instancia de la clase DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // Invoque el método setUseHighQualityRendering para establecer un valor que determine si se utilizan o no algoritmos de representación de alta calidad (es decir, lentos).
        opt.setUseHighQualityRendering(true);
        // llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX
        document.save("output.docx", SaveFormat.DOCX);

Obtenga una licencia gratis

Puede obtener una licencia temporal gratuita para probar la API sin limitaciones de evaluación.

Resumiendo

Esto nos lleva al final de esta publicación de blog. Hemos cubierto cómo convertir HTML a Word usando Java mediante programación. Además, puede encontrar fragmentos de código de la funcionalidad mencionada en las secciones anteriores. Además, puede visitar la documentación para conocer otras características que pueden ser beneficiosas para su convertidor de HTML a Word. Finalmente, conholdate.com está escribiendo nuevas publicaciones de blog sobre otros temas. Por lo tanto, manténgase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Puedes compartir tus dudas o consultas en nuestro foro.

Ver también