Вы можете легко программно преобразовать документы PDF в документы Word (.docx или .doc) в приложениях Java. Такое преобразование полезно, когда вам нужно отредактировать текст ваших PDF-документов или применить форматирование текста. В этой статье вы узнаете, как конвертировать PDF в Word с помощью Java.
В этой статье обсуждаются/рассматриваются следующие темы:
- Java API для преобразования PDF в Word
- Преобразование PDF в Word с помощью Java
- Преобразование определенных страниц PDF в Word
- Загрузить защищенный паролем PDF и преобразовать в Word
Java API для преобразования PDF в Word
Я буду использовать GroupDocs.Conversion for Java API для преобразования PDF в DOCX. Этот API обеспечивает быстрое, эффективное и надежное решение для преобразования файлов в приложения Java без установки какого-либо внешнего программного обеспечения. Он поддерживает преобразование между всеми популярными форматами деловых документов, такими как PDF, HTML, электронная почта, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, форматы файлов растровых изображений и многие другие. Это также позволяет вам отображать весь документ или отображать его частично, чтобы ускорить процесс. API совместим со всеми версиями Java и поддерживает популярные операционные системы (Windows, Linux, macOS), способные запускать среду выполнения Java.
Скачать и настроить
Вы можете загрузить JAR API или просто добавить следующую конфигурацию pom.xml в свое Java-приложение на основе Maven, чтобы попробовать приведенные ниже примеры кода.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.7</version>
</dependency>
Преобразование PDF в Word с помощью Java
Вы можете конвертировать PDF-документы в Word, выполнив простые шаги, указанные ниже:
- Создайте экземпляр класса Converter.
- Укажите путь к входному файлу
- Создайте экземпляр WordProcessingConvertOptions.
- Установить номер начальной страницы
- Укажите общее количество страниц для преобразования
- Установить формат выходного файла
- Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.
В следующем примере кода показано, как преобразовать файл PDF в документ Word с помощью Java.
// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf");
// установить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);
// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);
Класс Converter — это основной класс, управляющий процессом преобразования документа. Он предоставляет различные методы для преобразования документов поддерживаемых форматов файлов. Метод Convert() этого класса преобразует исходные документы и принимает два входных параметра: путь к файлу исходного документа и ConvertOptions для преобразования определенного исходного документа в желаемый целевой тип файла.
Класс WordProcessingConvertOptions предоставляет параметры для преобразования в тип файла WordProcessing. Метод setPageNumber() позволяет установить начальный номер страницы для начала конвертации. Принимая во внимание, что метод setPagesCount() определяет общее количество страниц, которые необходимо преобразовать, начиная с определенного номера страницы. Метод setFormat() этого класса позволяет установить выходной формат преобразованного документа. В качестве входных данных он принимает тип перечисления WordProcessingFileType.
Преобразование определенных страниц PDF в Word
Вы можете преобразовать определенные страницы документа PDF в Word, выполнив простые шаги, указанные ниже:
- Создайте экземпляр класса Converter.
- Укажите путь к входному файлу
- Создайте экземпляр WordProcessingConvertOptions.
- Установите список номеров страниц для преобразования
- Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.
В следующем примере кода показано, как преобразовать определенные страницы из файла PDF в документ Word с помощью Java.
// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf");
// определить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));
// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);
Класс WordProcessingConvertOptions предоставляет метод setPages() для преобразования определенных номеров страниц, определенных в списке, разделенном запятыми, из исходного документа.
Загрузить защищенный паролем PDF и преобразовать в Word
Вы можете преобразовать защищенные паролем PDF-документы в Word, выполнив простые шаги, указанные ниже:
- Создайте PdfLoadOptions
- Установка пароля
- Создайте экземпляр класса Converter.
- Укажите путь к входному файлу
- Создайте экземпляр WordProcessingConvertOptions.
- Вызовите метод Convert() вместе с путем к выходному файлу и параметрами преобразования.
В следующем примере кода показано, как преобразовать файл PDF, защищенный паролем, в документ Word с помощью Java.
// Параметры загрузки PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");
// создать конвертер
Converter конвертироватьer = new Converter("C:\\Files\\sample.pdf", loadOptions);
// определить параметры преобразования Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
// конвертировать
конвертироватьer.конвертировать("C:\\Files\\output.docx", options);
Класс PdfLoadOptions предоставляет различные параметры для загрузки PDF-документов. Метод setPassword() этого класса позволяет снять защиту с защищенного документа, указав его пароль.
Вы можете найти более подробную информацию о «Загрузить PDF-документ с параметрами» в документации.
Получить бесплатную лицензию
Вы можете попробовать API без ограничений по ознакомительной версии, запросив бесплатную временную лицензию.
Вывод
В этой статье вы узнали, как конвертировать PDF-документы в Word с помощью Java. Вы также узнали, как преобразовать защищенный паролем PDF-файл в документ Word. Кроме того, вы узнали, как программно конвертировать определенные страницы из документа PDF в документ Word. Вы можете узнать больше о Java API GroupDocs.Conversion, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.