Convert PDF to Word using Java

Java 응용 프로그램에서 프로그래밍 방식으로 PDF 문서를 Word 문서(.docx 또는 .doc)로 쉽게 변환할 수 있습니다. 이러한 변환은 PDF 문서의 텍스트를 편집해야 하거나 텍스트 서식을 적용해야 할 때 유용합니다. 이 기사에서는 Java를 사용하여 PDF를 Word로 변환하는 방법을 배웁니다.

이 문서에서는 다음 주제를 논의/다룹니다.

PDF를 Word로 변환하는 Java API

PDFDOCX로 변환하기 위해 GroupDocs.Conversion for Java API를 사용할 것입니다. 이 API는 외부 소프트웨어를 설치하지 않고도 빠르고 효율적이며 안정적인 파일 변환 솔루션을 Java 응용 프로그램으로 제공합니다. PDF, HTML, 이메일, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, 래스터 이미지 파일 형식 등과 같은 모든 인기 있는 비즈니스 문서 형식 간의 변환을 지원합니다. 또한 전체 문서를 표시하거나 프로세스 속도를 높이기 위해 부분적으로 렌더링할 수 있습니다. API는 모든 Java 버전과 호환되며 Java 런타임을 실행할 수 있는 널리 사용되는 운영 체제(Windows, Linux, macOS)를 지원합니다.

다운로드 및 구성

API의 JAR을 다운로드하거나 Maven 기반 Java 애플리케이션에 다음 pom.xml 구성을 추가하여 아래에 언급된 코드 예제를 시도할 수 있습니다.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Java를 사용하여 PDF를 Word로 변환

아래의 간단한 단계에 따라 PDF 문서를 Word로 변환할 수 있습니다.

  1. Converter 클래스의 인스턴스 생성
  2. 입력 파일 경로 제공
  3. WordProcessingConvertOptions 인스턴스 만들기
  4. 시작 페이지 번호 설정
  5. 전환할 총 페이지 제공
  6. 출력 파일 형식 설정
  7. 출력 파일 경로 및 변환 옵션과 함께 Convert() 메서드를 호출합니다.

다음 코드 샘플은 Java를 사용하여 PDF 파일을 Word 문서로 변환하는 방법을 보여줍니다.

// 변환기 생성
Converter 전환하다er = new Converter("C:\\Files\\sample.pdf");

// Word 변환 옵션 설정
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// 전환하다
전환하다er.전환하다("C:\\Files\\output.docx", options);
Java를 사용하여 PDF를 Word로 변환

Java를 사용하여 PDF를 Word로 변환

Converter 클래스는 문서 변환 프로세스를 제어하는 기본 클래스입니다. 지원되는 파일 형식의 문서를 변환하는 다양한 방법을 제공합니다. 이 클래스의 Convert() 메서드는 소스 문서를 변환하고 두 개의 입력 매개변수, 즉 소스 문서의 파일 경로와 ConvertOptions를 사용하여 특정 소스 문서를 원하는 대상 파일 형식으로 변환합니다.

WordProcessingConvertOptions 클래스는 WordProcessing 파일 형식으로 변환하는 옵션을 제공합니다. setPageNumber() 메서드를 사용하면 시작 페이지 번호를 설정하여 변환을 시작할 수 있습니다. 반면 setPagesCount() 메서드는 정의된 페이지 번호부터 변환할 총 페이지 수를 정의합니다. 이 클래스의 setFormat() 메서드를 사용하면 변환된 문서의 출력 형식을 설정할 수 있습니다. WordProcessingFileType 열거형을 입력으로 받습니다.

PDF의 특정 페이지를 Word로 변환

아래의 간단한 단계에 따라 PDF 문서의 특정 페이지를 Word로 변환할 수 있습니다.

  1. Converter 클래스의 인스턴스 생성
  2. 입력 파일 경로 제공
  3. WordProcessingConvertOptions 인스턴스 만들기
  4. 변환할 페이지 번호 목록 설정
  5. 출력 파일 경로 및 변환 옵션과 함께 Convert() 메서드를 호출합니다.

다음 코드 샘플은 Java를 사용하여 PDF 파일의 특정 페이지를 Word 문서로 변환하는 방법을 보여줍니다.

// 변환기 생성
Converter 전환하다er = new Converter("C:\\Files\\sample.pdf");

// Word 변환 옵션 정의
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// 전환하다
전환하다er.전환하다("C:\\Files\\output.docx", options);

WordProcessingConvertOptions 클래스는 소스 문서에서 쉼표로 구분된 목록에 정의된 특정 페이지 번호를 변환하는 setPages() 메서드를 제공합니다.

암호로 보호된 PDF 로드 및 Word로 변환

아래에 제공된 간단한 단계에 따라 암호로 보호된 PDF 문서를 Word로 변환할 수 있습니다.

  1. PdfLoadOptions 만들기
  2. 암호를 설정하세요
  3. Converter 클래스의 인스턴스 생성
  4. 입력 파일 경로 제공
  5. WordProcessingConvertOptions 인스턴스 만들기
  6. 출력 파일 경로 및 변환 옵션과 함께 Convert() 메서드를 호출합니다.

다음 코드 샘플은 Java를 사용하여 암호로 보호된 PDF 파일을 Word 문서로 변환하는 방법을 보여줍니다.

// PDF 로드 옵션
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// 변환기 생성
Converter 전환하다er = new Converter("C:\\Files\\sample.pdf", loadOptions);

// Word 변환 옵션 정의
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// 전환하다
전환하다er.전환하다("C:\\Files\\output.docx", options);

PdfLoadOptions 클래스는 PDF 문서를 로드하는 다양한 옵션을 제공합니다. 이 클래스의 setPassword() 메서드를 사용하면 암호를 제공하여 보호된 문서의 보호를 해제할 수 있습니다.

문서에서 “옵션이 있는 PDF 문서 로드“에 대한 자세한 내용을 찾을 수 있습니다.

무료 라이선스 받기

무료 임시 라이선스를 요청하면 평가 제한 없이 API를 사용해 볼 수 있습니다.

결론

이 기사에서는 Java를 사용하여 PDF 문서를 Word로 변환하는 방법을 배웠습니다. 암호로 보호된 PDF 파일을 Word 문서로 변환하는 방법도 배웠습니다. 또한 프로그래밍 방식으로 PDF의 특정 페이지를 Word 문서로 변환하는 방법을 배웠습니다. 문서를 사용하여 GroupDocs.Conversion Java API에 대해 더 자세히 알아볼 수 있습니다. 모호한 부분이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.

또한보십시오