
Convertir HTML a Word usando Java
Esta publicación de blog le enseñará cómo convertir HTML a Word usando Java mediante programación. Afortunadamente, esta biblioteca Java ofrece procesamiento, manipulación y conversión instantáneos de archivos. Puede instalar esta biblioteca fácilmente sin dependencias externas. Además, existe documentación completa disponible con respecto a su instalación y uso. Los documentos de Microsoft Word son los formatos de archivo más utilizados en la actualidad. Por lo tanto, demostraremos el proceso de conversión de HTML a Word paso a paso.
Cubriremos los siguientes puntos:
- Convertir HTML a Word usando Java - Instalación de API
- Cómo convertir WebPage a Word programáticamente
- Biblioteca de conversión de HTML a Word - Funciones avanzadas
Convertir HTML a Word usando Java - Instalación de API
Esta biblioteca Java DOCX proporciona una gran cantidad de características que impulsan los procesos de conversión de archivos. Le da control sobre las tareas de manipulación de datos y archivos. Para habilitar esta biblioteca en su aplicación Java, descargue los archivos jar o puede seguir las siguientes configuraciones de Maven.
Repositorio
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Dependencia
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Cómo convertir WebPage a Word programáticamente
Convertir una página HTML en un documento de Word mediante programación es muy simple. Puede lograr esta funcionalidad siguiendo un par de pasos que se mencionan a continuación.
- Cree una instancia de la clase Documento y cargue un archivo HTML fuente.
- Llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX.
Copie y pegue el siguiente código en su archivo Java para convertir un archivo HTML a un archivo de Word.
// cree una instancia de la clase Document y cargue un archivo HTML de origen
Document document = new Document("index.html");
// llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX
document.save("output.docx", SaveFormat.DOCX);
Biblioteca de conversión de HTML a Word - Funciones avanzadas
En esta sección, exploraremos las funciones avanzadas, como la configuración de la calidad del documento, la configuración de una contraseña y más.
Puede seguir los siguientes pasos y los fragmentos de código para conocer otros métodos:
- Cree una instancia de la clase Documento y cargue un archivo HTML fuente.
- El método protect(int type, java.lang.String password) le permitirá establecer una contraseña para proteger el documento de cualquier cambio.
- unprotect() eliminará la contraseña.
- Establezca este método setTrackRevisions en True si se realiza un seguimiento de los cambios cuando se edita este documento en Microsoft Word.
- Los errores ortográficos se resaltarán si el método setShowSpellingErrors es verdadero.
- El método setShowGrammicalErrors resaltará los errores gramaticales si es Verdadero.
- removeAllChildren elimina todos los nodos secundarios del nodo actual.
- Crea una instancia de la clase DocSaveOptions.
- Invoque el método setUseHighQualityRendering para establecer un valor que determine si usar o no algoritmos de renderizado de alta calidad (es decir, lento).
- Llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX.
// cree una instancia de la clase Document y cargue un archivo HTML de origen
Document document = new Document("index.html");
// El método protect(int type, java.lang.String password) le permitirá establecer una contraseña para proteger el documento de cualquier cambio
document.protect(1,"password");
// unprotect() eliminará la contraseña
document.unprotect();
// establezca este método setTrackRevisions en True si se realiza un seguimiento de los cambios cuando se edita este documento en Microsoft Word.
document.setTrackRevisions(true);
// los errores ortográficos se resaltarán si el método setShowSpellingErrors es verdadero
document.setShowSpellingErrors(true);
// El método setShowGrammicalErrors resaltará los errores gramaticales si es True
document.setShowGrammaticalErrors(true);
// removeAllChildren elimina todos los nodos secundarios del nodo actual.
document.removeAllChildren();
// instanciar una instancia de la clase DocSaveOptions
DocSaveOptions opt = new DocSaveOptions();
// Invoque el método setUseHighQualityRendering para establecer un valor que determine si se utilizan o no algoritmos de representación de alta calidad (es decir, lentos).
opt.setUseHighQualityRendering(true);
// llame al método save(java.lang.String fileName, int saveFormat) para guardar el archivo en formato DOCX
document.save("output.docx", SaveFormat.DOCX);
Obtenga una licencia gratis
Puede obtener una licencia temporal gratuita para probar la API sin limitaciones de evaluación.
Resumiendo
Esto nos lleva al final de esta publicación de blog. Hemos cubierto cómo convertir HTML a Word usando Java mediante programación. Además, puede encontrar fragmentos de código de la funcionalidad mencionada en las secciones anteriores. Además, puede visitar la documentación para conocer otras características que pueden ser beneficiosas para su convertidor de HTML a Word. Finalmente, conholdate.com está escribiendo nuevas publicaciones de blog sobre otros temas. Por lo tanto, manténgase en contacto para recibir actualizaciones periódicas.
Hacer una pregunta
Puedes compartir tus dudas o consultas en nuestro foro.