Convert PDF to Word using Java

Вы можете легко программно преобразовать документы PDF в документы Word (.docx или .doc) в приложениях Java. Такое преобразование полезно, когда вам нужно отредактировать текст ваших PDF-документов или применить форматирование текста. В этой статье вы узнаете, как конвертировать PDF в Word с помощью Java.

В этой статье обсуждаются/рассматриваются следующие темы:

Java API для преобразования PDF в Word

Я буду использовать GroupDocs.Conversion for Java API для преобразования PDF в DOCX. Этот API обеспечивает быстрое, эффективное и надежное решение для преобразования файлов в приложения Java без установки какого-либо внешнего программного обеспечения. Он поддерживает преобразование между всеми популярными форматами деловых документов, такими как PDF, HTML, электронная почта, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, форматы файлов растровых изображений и многие другие. Это также позволяет вам отображать весь документ или отображать его частично, чтобы ускорить процесс. API совместим со всеми версиями Java и поддерживает популярные операционные системы (Windows, Linux, macOS), способные запускать среду выполнения Java.

Скачать и настроить

Вы можете загрузить JAR API или просто добавить следующую конфигурацию pom.xml в свое Java-приложение на основе Maven, чтобы попробовать приведенные ниже примеры кода.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Преобразование PDF в Word с помощью Java

Вы можете конвертировать PDF-документы в Word, выполнив простые шаги, указанные ниже:

  1. Создайте экземпляр класса Converter.
  2. Укажите путь к входному файлу
  3. Создайте экземпляр WordProcessingConvertOptions.
  4. Установить номер начальной страницы
  5. Укажите общее количество страниц для преобразования
  6. Установить формат выходного файла
  7. Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.

В следующем примере кода показано, как преобразовать файл PDF в документ Word с помощью Java.

// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf");

// установить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);
Преобразование PDF в Word с помощью Java

Преобразование PDF в Word с помощью Java

Класс Converter — это основной класс, управляющий процессом преобразования документа. Он предоставляет различные методы для преобразования документов поддерживаемых форматов файлов. Метод Convert() этого класса преобразует исходные документы и принимает два входных параметра: путь к файлу исходного документа и ConvertOptions для преобразования определенного исходного документа в желаемый целевой тип файла.

Класс WordProcessingConvertOptions предоставляет параметры для преобразования в тип файла WordProcessing. Метод setPageNumber() позволяет установить начальный номер страницы для начала конвертации. Принимая во внимание, что метод setPagesCount() определяет общее количество страниц, которые необходимо преобразовать, начиная с определенного номера страницы. Метод setFormat() этого класса позволяет установить выходной формат преобразованного документа. В качестве входных данных он принимает тип перечисления WordProcessingFileType.

Преобразование определенных страниц PDF в Word

Вы можете преобразовать определенные страницы документа PDF в Word, выполнив простые шаги, указанные ниже:

  1. Создайте экземпляр класса Converter.
  2. Укажите путь к входному файлу
  3. Создайте экземпляр WordProcessingConvertOptions.
  4. Установите список номеров страниц для преобразования
  5. Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.

В следующем примере кода показано, как преобразовать определенные страницы из файла PDF в документ Word с помощью Java.

// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf");

// определить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);

Класс WordProcessingConvertOptions предоставляет метод setPages() для преобразования определенных номеров страниц, определенных в списке, разделенном запятыми, из исходного документа.

Загрузить защищенный паролем PDF и преобразовать в Word

Вы можете преобразовать защищенные паролем PDF-документы в Word, выполнив простые шаги, указанные ниже:

  1. Создайте PdfLoadOptions
  2. Установка пароля
  3. Создайте экземпляр класса Converter.
  4. Укажите путь к входному файлу
  5. Создайте экземпляр WordProcessingConvertOptions.
  6. Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.

В следующем примере кода показано, как преобразовать файл PDF, защищенный паролем, в документ Word с помощью Java.

// Параметры загрузки PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf", loadOptions);

// определить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);

Класс PdfLoadOptions предоставляет различные параметры для загрузки PDF-документов. Метод setPassword() этого класса позволяет снять защиту с защищенного документа, указав его пароль.

Вы можете найти более подробную информацию о «Загрузить PDF-документ с параметрами» в документации.

Получить бесплатную лицензию

Вы можете попробовать API без ограничений по ознакомительной версии, запросив бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как конвертировать PDF-документы в Word с помощью Java. Вы также узнали, как преобразовать защищенный паролем PDF-файл в документ Word. Кроме того, вы узнали, как программно конвертировать определенные страницы из документа PDF в документ Word. Вы можете узнать больше о Java API GroupDocs.Conversion, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также