Java를 사용하여 PDF를 HTML로 변환

PDF는 문서 형식을 잃지 않고 읽기 전용 문서를 공유하고 인쇄할 수 있습니다. PDF 문서를 HTML 웹 페이지로 쉽게 변환하고 모든 브라우저에서 볼 수 있습니다. 이 기사에서는 Java를 사용하여 PDF 문서를 HTML 웹 페이지로 변환하는 방법을 배웁니다.

이 기사에서는 다음 주제를 다룹니다.

PDF를 HTML로 변환하는 Java API — 무료 다운로드

PDF를 HTML로 변환하기 위해 GroupDocs.Conversion for Java API를 사용할 것입니다. 최종 사용자에게 빠르고 효율적이며 안정적인 파일 변환 솔루션을 제공합니다. API의 JAR을 다운로드하거나 Maven 기반 Java 애플리케이션에 다음 pom.xml 구성을 추가하십시오.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Java를 사용하여 PDF에서 HTML로 변환

아래의 간단한 단계에 따라 프로그래밍 방식으로 PDF 문서를 HTML 웹 페이지로 쉽게 변환할 수 있습니다.

  1. 먼저 Converter 클래스를 사용하여 PDF 문서를 로드합니다.
  2. 다음으로 MarkupConvertOptions 클래스의 인스턴스를 만듭니다.
  3. 그런 다음 선택적으로 FixedLayout, FixedLayoutShowBorders 등과 같은 다양한 변환 옵션을 설정합니다.
  4. 마지막으로 Converter.Convert() 메서드를 사용하여 PDF를 HTML로 변환합니다. 출력 파일 경로를 취하고 옵션을 인수로 변환합니다.

다음 코드 샘플은 Java를 사용하여 PDF 문서를 HTML 웹 페이지로 변환하는 방법을 보여줍니다.

// 이 코드 예제는 PDF 문서를 HTML 파일로 변환하는 방법을 보여줍니다.
// 변환 클래스 개체 초기화
전환하다er converter = new 전환하다er("C:\\Files\\Conversion\\sample.pdf");

// 변환 옵션 정의
Markup전환하다Options options = new Markup전환하다Options();
options.setFixedLayout(true);

// 전환하다
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Java를 사용하여 PDF에서 HTML로 변환

Java를 사용하여 PDF에서 HTML로 변환.

페이지 범위를 PDF에서 HTML로 변환

다음 단계에 따라 PDF 문서의 페이지 범위를 HTML로 변환할 수 있습니다.

  1. 먼저 Converter 클래스를 사용하여 PDF 문서를 로드합니다.
  2. 다음으로 MarkupConvertOptions 클래스의 인스턴스를 만듭니다.
  3. 그런 다음 변환을 시작할 페이지 번호를 설정합니다.
  4. 그런 다음 페이지 수를 설정하여 총 페이지 수를 변환합니다.
  5. 마지막으로 Converter.Convert() 메서드를 사용하여 PDF를 HTML로 변환합니다.

다음 코드 샘플은 Java를 사용하여 PDF 문서의 페이지 범위를 HTML 파일로 변환하는 방법을 보여줍니다.

// 이 코드 예제는 PDF 페이지 범위를 HTML 파일로 변환하는 방법을 보여줍니다.
// 변환 클래스 개체 초기화
전환하다er converter = new 전환하다er("C:\\Files\\Conversion\\sample.pdf");

// 변환 옵션 정의
Markup전환하다Options options = new Markup전환하다Options();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// 전환하다
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

PDF의 특정 페이지를 HTML로 변환

다음 단계에 따라 PDF 문서의 특정 페이지를 HTML로 변환할 수 있습니다.

  1. 먼저 Converter 클래스를 사용하여 PDF 문서를 로드합니다.
  2. 다음으로 MarkupConvertOptions 클래스의 인스턴스를 만듭니다.
  3. 그런 다음 변환할 특정 페이지 번호를 쉼표로 구분된 목록으로 제공합니다.
  4. 마지막으로 Converter.Convert() 메서드를 사용하여 PDF를 HTML로 변환합니다.

다음 코드 샘플은 Java를 사용하여 PDF 문서의 특정 페이지를 HTML 파일로 변환하는 방법을 보여줍니다.

// 이 코드 예제는 PDF 문서의 특정 페이지를 HTML 파일로 변환하는 방법을 보여줍니다.
// 변환 클래스 개체 초기화
전환하다er converter = new 전환하다er("C:\\Files\\Conversion\\sample.pdf");

// 변환 옵션 정의
Markup전환하다Options options = new Markup전환하다Options();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// 전환하다
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Java에서 암호로 보호된 PDF를 HTML로 변환

암호로 보호된 PDF 문서를 아래 단계에 따라 HTML 웹페이지로 변환할 수도 있습니다.

  1. 먼저 PdfLoadOptions 클래스 개체를 사용하여 암호를 제공합니다.
  2. 그런 다음 PdfLoadOptions와 함께 Converter 클래스를 사용하여 PDF 문서를 로드합니다.
  3. 그런 다음 MarkupConvertOptions 클래스의 인스턴스를 만듭니다.
  4. 마지막으로 Converter.Convert() 메서드를 사용하여 PDF를 HTML로 변환합니다.

다음 코드 샘플은 Java를 사용하여 암호로 보호된 PDF 문서를 HTML 문서로 변환하는 방법을 보여줍니다.

// 이 코드 예제는 암호로 보호된 PDF를 HTML로 변환하는 방법을 보여줍니다.
// 로드 옵션 정의
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// 변환 클래스 개체 초기화
전환하다er converter = new 전환하다er("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// 변환 옵션 정의
Markup전환하다Options options = new Markup전환하다Options();

// 전환하다
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Java에서 워터마크를 사용하여 PDF를 HTML로 변환

아래 단계에 따라 PDF 문서를 HTML 웹페이지로 변환하고 변환된 HTML 파일에 워터마크를 추가할 수 있습니다.

  1. 먼저 Converter 클래스를 사용하여 PDF 문서를 로드합니다.
  2. 다음으로 WatermarkOptions 클래스의 인스턴스를 만듭니다.
  3. 그런 다음 텍스트, 색상, 너비, 높이, 글꼴 등 다양한 옵션을 설정합니다.
  4. 다음으로 MarkupConvertOptions 클래스의 인스턴스를 만듭니다.
  5. 그런 다음 WatermarkOptions를 MarkupConvertOptions에 할당합니다.
  6. 마지막으로 Converter.Convert() 메서드를 사용하여 PDF를 HTML로 변환합니다.

다음 코드 샘플은 PDF 문서를 워터마크가 있는 HTML 문서로 변환하는 방법을 보여줍니다.

// 이 코드 예제는 워터마크가 있는 PDF를 HTML로 변환하는 방법을 보여줍니다.
// 변환 클래스 개체 초기화
전환하다er converter = new 전환하다er("C:\\Files\\Conversion\\sample.pdf");

// 워터마크 정의 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// 변환 옵션 정의
Markup전환하다Options options = new Markup전환하다Options();
options.setWatermark(watermark);

// 출력 파일 경로
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// 전환하다
converter.convert(outputFile, options);
Java에서 워터마크를 사용하여 PDF를 HTML로 변환

Java에서 워터마크를 사용하여 PDF에서 HTML로 변환.

무료 라이선스 받기

임시 무료 라이선스를 신청하여 평가 제한 없이 API를 사용해 보세요.

결론

이 기사에서는 PDF 문서를 Java에서 HTML 웹 페이지로 변환하는 방법을 배웠습니다. 또한 암호로 보호된 PDF 파일을 HTML로 변환하고 변환된 파일에 프로그래밍 방식으로 워터마크를 추가하는 방법도 살펴보았습니다. 또한 문서를 사용하여 Java API용 GroupDocs.Conversion에 대해 자세히 알아볼 수 있습니다. 모호한 부분이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.

또한보십시오