Convert PDF to Word using Java

Vous pouvez facilement convertir vos documents PDF en documents Word (.docx ou .doc) par programmation dans vos applications Java. Une telle conversion est utile lorsque vous avez besoin de modifier le texte de vos documents PDF ou d’appliquer la mise en forme du texte. Dans cet article, vous allez apprendre comment convertir un PDF en Word en utilisant Java.

Les sujets suivants sont abordés/couverts dans cet article:

API Java pour convertir PDF en Word

J’utiliserai GroupDocs.Conversion for Java API pour la conversion de PDF en DOCX. Cette API fournit une solution de conversion de fichiers rapide, efficace et fiable en applications Java sans installer de logiciel externe. Il prend en charge les conversions parmi tous les formats de documents commerciaux courants tels que PDF, HTML, e-mail, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, les formats de fichiers d’image raster et bien d’autres. Il vous permet également d’afficher l’intégralité du document ou de le rendre partiellement pour accélérer le processus. L’API est compatible avec toutes les versions de Java et prend en charge les systèmes d’exploitation courants (Windows, Linux, macOS) capables d’exécuter l’environnement d’exécution Java.

Télécharger et configurer

Vous pouvez télécharger le JAR de l’API ou simplement ajouter la configuration pom.xml suivante dans votre application Java basée sur Maven pour essayer les exemples de code mentionnés ci-dessous.

<repository>
  <id>GroupDocsJavaAPI</id>
  <name>API Java GroupDocs</name>
  <url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
  <groupId>com.groupdocs</groupId>
  <artifactId>groupdocs-conversion</artifactId>
  <version>21.7</version>
</dependency>

Convertir PDF en Word en utilisant Java

Vous pouvez convertir des documents PDF en Word en suivant les étapes simples ci-dessous:

  1. Créez une instance de la classe Converter
  2. Indiquez le chemin du fichier d’entrée
  3. Créez une instance de WordProcessingConvertOptions
  4. Définir le numéro de la page de démarrage
  5. Fournir le nombre total de pages à convertir
  6. Définir le format du fichier de sortie
  7. Appelez la Convert() method avec le chemin du fichier de sortie et les options de conversion

L’exemple de code suivant montre comment convertir un fichier PDF en un document Word à l’aide de Java.

// créer un convertirisseur
Converter convertirer = new Converter("C:\\Files\\sample.pdf");

// définir les options de conversion de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);
Convertir PDF en Word en utilisant Java

Convertir PDF en Word en utilisant Java

La classe Converter est la classe principale qui contrôle le processus de conversion du document. Il fournit diverses méthodes pour convertir des documents de formats de fichiers pris en charge. La méthode Convert() de cette classe convertit les documents source et prend deux paramètres d’entrée, le chemin d’accès au document source et ConvertOptions pour convertir un document source spécifique en type de fichier cible souhaité.

La classe WordProcessingConvertOptions fournit des options pour la conversion vers le type de fichier WordProcessing. La méthode setPageNumber() permet de définir le numéro de page de départ pour démarrer la conversion. Alors que la méthode setPagesCount() définit le nombre total de pages à convertir à partir du numéro de page défini. La méthode setFormat() de cette classe vous permet de définir le format de sortie du document converti. Il prend le type d’énumération WordProcessingFileType comme entrée.

Convertir des pages spécifiques de PDF en Word

Vous pouvez convertir des pages spécifiques d’un document PDF en Word en suivant les étapes simples ci-dessous:

  1. Créez une instance de la classe Converter
  2. Indiquez le chemin du fichier d’entrée
  3. Créez une instance de WordProcessingConvertOptions
  4. Définir la liste des numéros de page à convertir
  5. Appelez la Convert() method avec le chemin du fichier de sortie et les options de conversion

L’exemple de code suivant montre comment convertir des pages spécifiques d’un fichier PDF en un document Word à l’aide de Java.

// créer un convertirisseur
Converter convertirer = new Converter("C:\\Files\\sample.pdf");

// définir les options de conversion de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);

La classe WordProcessingConvertOptions fournit la méthode setPages() pour convertir des numéros de page spécifiques définis dans une liste séparée par des virgules à partir d’un document source.

Charger un PDF protégé par mot de passe et le convertir en Word

Vous pouvez convertir des documents PDF protégés par mot de passe en Word en suivant les étapes simples ci-dessous:

  1. Créer PdfLoadOptions
  2. Définir le mot de passe
  3. Créez une instance de la classe Converter
  4. Indiquez le chemin du fichier d’entrée
  5. Créez une instance de WordProcessingConvertOptions
  6. Appelez la Convert() method avec le chemin du fichier de sortie et les options de conversion

L’exemple de code suivant montre comment convertir un fichier PDF protégé par mot de passe en un document Word à l’aide de Java.

// Options de chargement de PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// créer un convertirisseur
Converter convertirer = new Converter("C:\\Files\\sample.pdf", loadOptions);

// définir les options de conversion de Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// convertir
convertirer.convertir("C:\\Files\\output.docx", options);

La classe PdfLoadOptions fournit diverses options pour charger des documents PDF. La méthode setPassword() de cette classe permet de déprotéger le document protégé en fournissant son mot de passe.

Vous pouvez trouver plus de détails sur “Charger un document PDF avec des options” dans la documentation.

Obtenez une licence gratuite

Vous pouvez essayer l’API sans limitation d’évaluation en demandant une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez appris comment convertir des documents PDF en Word en utilisant Java. Vous avez également appris comment convertir un fichier PDF protégé par mot de passe en un document Word. De plus, vous avez appris comment convertir des pages spécifiques d’un PDF en un document Word par programmation. Vous pouvez en savoir plus sur l’API Java GroupDocs.Conversion en utilisant la documentation. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également