Convertir Word en Markdown en utilisant Java

Convertir Word en Markdown en utilisant Java

Le langage Markdown offre une riche pile de fonctionnalités et est facile à apprendre. Alors que les documents MS Word ont toujours été un plus pour organiser et représenter les données d’entreprise de manière bien entretenue. Cependant, dans le développement rapide d’applications, il est vraiment important d’adapter les changements au moment de l’exécution. Par conséquent, les fichiers Markdown offrent beaucoup en matière de développement d’applications professionnelles. Ce billet de blog vous montrera comment convertir Word en Markdown en utilisant Java par programmation.

Nous couvrirons les sections suivantes :

Installation de la bibliothèque Java Docx

Il s’agit d’une bibliothèque riche en fonctionnalités qui vous permet de créer un convertisseur Word vers Markdown de niveau entreprise pour votre application Java. Cependant, vous pouvez télécharger l’API ou simplement ajouter la configuration suivante dans vos applications Java basées sur Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Convertir Word en Markdown en utilisant Java

En fait, il existe de nombreuses méthodes exposées par cette bibliothèque Java Docx pour convertir par programmation des documents Word en d’autres formats de fichiers et d’images populaires.

Veuillez suivre les étapes et l’extrait de code mentionnés ci-dessous :

  1. Chargez un document Word source en initialisant le constructeur de la classe Document.
  2. Enregistrez le document au format Markdown en appelant la méthode save.

Copiez et collez le code suivant dans votre fichier principal :

// Chargez un document Word source en initialisant le constructeur de la classe Document. 
Document doc = new Document("sample.doc");
// Enregistrez le document au format Markdown en appelant la méthode save. 
doc.save(  "SaveDocx2Markdown.md");

Vous pouvez voir la sortie dans l’image ci-dessous :

Convertisseur Word en Markdown

Convertisseur Word en Markdown - options avancées

Voyons quelques-unes des autres fonctionnalités importantes de cette bibliothèque Java. Nous allons donc créer un document avec quelques styles et l’enregistrer dans Markdown :

Les étapes sont :

  1. Créez un objet de la classe Document.
  2. Instanciez une instance de la classe DocumentBuilder pour faciliter l’ajout de contenu au document.
  3. Spécifiez le style “Titre 1” pour le paragraphe en appelant la méthode insertParagraph.
  4. Appelez la méthode setStyleName pour définir le nom du style de paragraphe appliqué à cette mise en forme.
  5. Insérez une chaîne dans le document à la position d’insertion actuelle en appelant la méthode write.
  6. Mettez le format de police en italique en appelant la méthode setItalic.
  7. Appelez la méthode insertHyperlink pour insérer un lien hypertexte dans le document.
  8. Appelez la méthode save pour enregistrer votre document en tant que fichier Markdown.
// Créez un objet de la classe Document. 
Document doc = new Document();
// Instanciez une instance de la classe DocumentBuilder pour faciliter l'ajout de contenu au document.
DocumentBuilder builder = new DocumentBuilder(doc);
// Spécifiez le style "Titre 1" pour le paragraphe en appelant la méthode insertParagraph. 
builder.insertParagraph();
// Appelez la méthode setStyleName pour définir le nom du style de paragraphe appliqué à cette mise en forme. 
builder.getParagraphFormat().setStyleName("Heading 1");
// Insérez une chaîne dans le document à la position d'insertion actuelle en appelant la méthode write. 
builder.write("Heading 1");
// Spécifiez l'accent mis en italique pour le paragraphe.
builder.insertParagraph();
// Réinitialisez les styles du paragraphe précédent pour ne pas combiner les styles entre les paragraphes.
builder.getParagraphFormat().setStyleName("Normal");
// Rendez le format de police en italique en appelant la méthode setItalic. 
builder.getFont().setItalic(true);
builder.write("Italic Text");
// Réinitialisez les styles du paragraphe précédent pour ne pas combiner les styles entre les paragraphes.
builder.setItalic(false);
// Spécifiez un lien hypertexte pour le texte souhaité.
builder.insertParagraph();
// Appelez la méthode insertHyperlink pour insérer un lien hypertexte dans le document. 
builder.insertHyperlink("Aspose","https://www.aspose.com", false);
builder.write("Aspose");
// Appelez la méthode save pour enregistrer votre document en tant que fichier Markdown.
doc.save(  "example.md");

La sortie est illustrée dans l’image ci-dessous :

Mot à MD

Obtenez une licence gratuite

Vous pouvez bénéficier d’une licence temporaire gratuite pour essayer l’API sans limitation d’évaluation.

Résumé

Nous pouvons terminer ce didacticiel ici en espérant que vous avez appris à convertir Word en Markdown à l’aide de Java par programme. De plus, vous avez également parcouru certaines méthodes avancées proposées par cette bibliothèque Java Docx. De plus, ne partez pas sans visiter la documentation de cette bibliothèque.

De plus, nous vous suggérons de suivre notre Guide de démarrage.

Enfin, conholdate.com écrit de nouveaux articles de blog. Par conséquent, veuillez rester en contact pour des mises à jour régulières.

poser une question

Vous pouvez nous faire part de vos questions ou requêtes sur notre forum.

FAQ

Comment créer un document HTML dans une application .NET ?

Chargez un document Word source en initialisant le constructeur de la classe Document. Ensuite, enregistrez le document au format Markdown en appelant la méthode save.

Voir également