Convertir Word en HTML en Java

Convertir Word en HTML en Java

Ce billet de blog est pour vous si vous souhaitez développer un convertisseur Word vers HTML pour votre application métier. Vous pouvez installer cette bibliothèque Java Word pour convertir les fichiers Docx vers d’autres formats populaires tels que HTML, PNG, PDF, et plus encore. Cependant, à la fin de ce tutoriel, vous devriez avoir une bonne connaissance de cette bibliothèque Java de conversion de fichiers. Par conséquent, commençons l’article et apprenons à convertir Word en HTML en Java par programmation.

Les points suivants seront abordés :

Installation de la bibliothèque Java Word

Le processus d’installation de cette bibliothèque est très convivial pour les développeurs car vous trouverez une documentation complète concernant le développement et l’installation. Ainsi, vous pouvez télécharger le fichier JAR ou installer cette bibliothèque en utilisant les configurations Maven suivantes.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Convertir Word en HTML en Java

Vous êtes prêt à écrire du code source dans votre application Java pour créer un convertisseur Word en HTML par programme.

Voici les étapes pour convertir Word en HTML :

  1. Créez une instance de la classe Document et chargez le fichier Word source.
  2. Initialisez un objet de la classe HtmlSaveOptions pour spécifier des options supplémentaires lors de l’enregistrement d’un document dans les formats HTML.
  3. Appelez setExportRoundtripInformation pour spécifier s’il faut écrire les informations d’aller-retour lors de l’enregistrement au format HTML.
  4. Si la valeur de la méthode setExportFontResources est true, les ressources de police seront exportées au format HTML.
  5. Appelez la méthode setExportFontsAsBase64 pour spécifier si les ressources de police doivent être incorporées dans HTML dans le codage Base64.
  6. Maintenant, la méthode save enregistrera le document Word au format HTML.

Copiez et collez le code suivant dans votre fichier principal :

// Créez une instance de la classe Document et chargez le fichier Word source. 
Document doc = new Document(  "sample.doc");
// Initialisez un objet de la classe HtmlSaveOptions pour spécifier des options supplémentaires lors de l'enregistrement d'un document aux formats HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Appelez setExportRoundtripInformation pour spécifier s'il faut écrire les informations d'aller-retour lors de l'enregistrement au format HTML.
options.setExportRoundtripInformation(true);
// Si la valeur de la méthode setExportFontResources est true, les ressources de police seront exportées au format HTML.
options.setExportFontResources(true);
// Appelez la méthode setExportFontsAsBase64 pour spécifier si les ressources de polices doivent être intégrées au HTML dans le codage Base64.
options.setExportFontsAsBase64(true);
// Maintenant, la méthode d'enregistrement enregistrera le document Word au format HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

La sortie peut être vue dans l’image ci-dessous:

mot en html

Obtenez une licence gratuite

Vous pouvez bénéficier d’une licence temporaire gratuite pour essayer l’API sans limitation d’évaluation.

Résumé

Nous pouvons terminer ce billet de blog ici. J’espère que vous avez apprécié l’article et que vous avez appris à convertir Word en HTML en Java par programmation. Il existe de nombreuses autres fonctionnalités exposées par cette bibliothèque Java Word, alors n’oubliez pas de visiter la documentation.

De plus, nous vous suggérons de suivre notre Guide de démarrage.

Enfin, conholdate.com écrit de nouveaux articles de blog. Alors, restez en contact pour des mises à jour régulières.

poser une question

Vous pouvez nous faire part de vos questions ou requêtes sur notre forum.

FAQ

Comment convertir un DOCX en HTML ?

Créez une instance de la classe Document et chargez le fichier Word source, puis appelez la méthode save pour enregistrer le fichier Word au format HTML.

Voir également