Convertir HTML en Word en utilisant Java

Convertir HTML en Word en utilisant Java

Ce billet de blog vous apprendra comment convertir HTML en Word en utilisant Java par programmation. Heureusement, cette bibliothèque Java offre un traitement, une manipulation et des conversions de fichiers instantanés. Vous pouvez installer cette bibliothèque facilement sans aucune dépendance externe. De plus, une documentation complète est disponible concernant son installation et son utilisation. Les documents Microsoft Word sont les formats de fichiers les plus utilisés à l’heure actuelle. Par conséquent, nous allons démontrer étape par étape le processus de conversion de HTML en Word.

Nous aborderons les points suivants :

Convertir HTML en Word à l’aide de Java - Installation de l’API

Cette bibliothèque Java DOCX fournit une énorme pile de fonctionnalités qui accélèrent les processus de conversion de fichiers. Il vous donne le contrôle sur les tâches de manipulation de données et de fichiers. Pour activer cette bibliothèque dans votre application Java, téléchargez les fichiers jar ou vous pouvez suivre les configurations Maven suivantes.

Dépôt

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dépendance

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Comment convertir une page Web en Word par programmation

Convertir une page HTML en un document Word par programmation est super simple. Vous pouvez obtenir cette fonctionnalité en suivant quelques étapes mentionnées ci-dessous.

  1. Créez une instance de la classe Document et chargez un fichier HTML source.
  2. Appelez la méthode save(java.lang.String fileName, int saveFormat) pour enregistrer le fichier au format DOCX.

Copiez et collez le code suivant dans votre fichier Java pour convertir le fichier HTML en fichier Word.

// créer une instance de la classe Document et charger un fichier HTML source
Document document = new Document("index.html");
// appelez la méthode save(java.lang.String fileName, int saveFormat) pour enregistrer le fichier au format DOCX
document.save("output.docx", SaveFormat.DOCX);

Bibliothèque de conversion HTML vers Word - Fonctionnalités avancées

Dans cette section, nous explorerons les fonctionnalités avancées telles que la définition de la qualité du document, la configuration d’un mot de passe, etc.

Vous pouvez suivre les étapes suivantes et les extraits de code pour connaître d’autres méthodes :

  1. Créez une instance de la classe Document et chargez un fichier HTML source.
  2. La méthode protect(int type, java.lang.String password) vous permettra de définir un mot de passe pour protéger le document de toute modification.
  3. unprotect() supprimera le mot de passe.
  4. Définissez cette méthode setTrackRevisions sur True si les modifications sont suivies lorsque ce document est modifié dans Microsoft Word.
  5. Les fautes d’orthographe seront mises en surbrillance si la méthode setShowSpellingErrors est True.
  6. La méthode setShowGrammaticalErrors mettra en évidence les erreurs grammaticales si True.
  7. removeAllChildren supprime tous les nœuds enfants du nœud actuel.
  8. Instanciez une instance de la classe DocSaveOptions.
  9. Appelez la méthode setUseHighQualityRendering pour définir une valeur déterminant s’il faut ou non utiliser des algorithmes de rendu de haute qualité (c’est-à-dire lents).
  10. Appelez la méthode save(java.lang.String fileName, int saveFormat) pour enregistrer le fichier au format DOCX.
        // créer une instance de la classe Document et charger un fichier HTML source
        Document document = new Document("index.html");
        // La méthode protect(int type, java.lang.String password) vous permettra de définir un mot de passe pour protéger le document de toute modification
        document.protect(1,"password");
        // unprotect() supprimera le mot de passe
        document.unprotect();
        // définissez cette méthode setTrackRevisions sur True si les modifications sont suivies lorsque ce document est modifié dans Microsoft Word.
        document.setTrackRevisions(true);
        // les fautes d'orthographe seront mises en surbrillance si la méthode setShowSpellingErrors est True
        document.setShowSpellingErrors(true);
        // La méthode setShowGrammicalErrors mettra en évidence les erreurs grammaticales si True
        document.setShowGrammaticalErrors(true);
        // removeAllChildren supprime tous les nœuds enfants du nœud actuel.
        document.removeAllChildren();
        // instancier une instance de la classe DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // appelez la méthode setUseHighQualityRendering pour définir une valeur déterminant s'il faut ou non utiliser des algorithmes de rendu de haute qualité (c'est-à-dire lents).
        opt.setUseHighQualityRendering(true);
        // appelez la méthode save(java.lang.String fileName, int saveFormat) pour enregistrer le fichier au format DOCX
        document.save("output.docx", SaveFormat.DOCX);

Obtenez une licence gratuite

Vous pouvez obtenir une licence temporaire gratuite pour essayer l’API sans limitation d’évaluation.

Résumé

Cela nous amène à la fin de cet article de blog. Nous avons expliqué comment convertir HTML en Word à l’aide de Java par programmation. De plus, vous pouvez trouver les extraits de code des fonctionnalités mentionnées dans les sections ci-dessus. De plus, vous pouvez visiter la documentation pour les autres fonctionnalités qui peuvent être bénéfiques pour votre convertisseur HTML vers Word. Enfin, conholdate.com rédige de nouveaux articles de blog sur d’autres sujets. Par conséquent, veuillez rester en contact pour des mises à jour régulières.

poser une question

Vous pouvez partager vos questions ou requêtes sur notre forum.

Voir également