Преобразование PDF в HTML с помощью Java

PDF предлагает делиться и печатать документы только для чтения без потери форматирования документов. Мы можем легко конвертировать документы PDF в веб-страницы HTML и просматривать их в любом браузере. В этой статье мы узнаем, как конвертировать документы PDF в веб-страницы HTML с помощью Java.

В этой статье должны быть раскрыты следующие темы:

Java API для преобразования PDF в HTML — скачать бесплатно

Для преобразования PDF в HTML мы будем использовать GroupDocs.Conversion for Java API. Он предоставляет конечным пользователям быстрые, эффективные и надежные решения для преобразования файлов. Пожалуйста, либо загрузите JAR API, либо просто добавьте следующую конфигурацию pom.xml в приложение Java на основе Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Преобразование PDF в HTML с использованием Java

Мы можем легко программно конвертировать PDF-документы в веб-страницы HTML, выполнив простые шаги, указанные ниже:

  1. Во-первых, загрузите PDF-документ с помощью класса Converter.
  2. Затем создайте экземпляр класса MarkupConvertOptions.
  3. Затем при необходимости установите различные параметры преобразования, такие как FixedLayout, FixedLayoutShowBorders и т. д.
  4. Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert(). Он принимает путь к выходному файлу и параметры преобразования в качестве аргументов.

В следующем примере кода показано, как преобразовать документ PDF в веб-страницу HTML с помощью Java.

// В этом примере кода показано, как преобразовать документ PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");

// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setFixedLayout(true);

// Конвертировать
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Преобразование PDF в HTML с использованием Java

Преобразование PDF в HTML с использованием Java.

Преобразование диапазона страниц из PDF в HTML

Мы можем преобразовать ряд страниц документа PDF в HTML, выполнив следующие действия:

  1. Во-первых, загрузите PDF-документ с помощью класса Converter.
  2. Затем создайте экземпляр класса MarkupConvertOptions.
  3. Затем установите номер страницы, с которой нужно начать преобразование.
  4. После этого установите количество страниц, чтобы преобразовать общее количество страниц.
  5. Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().

В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML с помощью Java.

// В этом примере кода показано, как преобразовать диапазон страниц PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");

// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Конвертировать
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Преобразование определенных страниц PDF в HTML

Мы можем преобразовать определенные страницы документа PDF в HTML, выполнив следующие действия:

  1. Во-первых, загрузите PDF-документ с помощью класса Converter.
  2. Затем создайте экземпляр класса MarkupConvertOptions.
  3. Затем укажите конкретные номера страниц в списке через запятую для преобразования.
  4. Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().

В следующем примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML с помощью Java.

// В этом примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");

// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Конвертировать
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Преобразование защищенного паролем PDF в HTML на Java

Мы также можем преобразовать защищенные паролем PDF-документы в веб-страницы HTML, выполнив следующие действия:

  1. Во-первых, укажите пароль, используя объект класса PdfLoadOptions .
  2. Затем загрузите PDF-документ с помощью класса Converter с PdfLoadOptions.
  3. Затем создайте экземпляр класса MarkupConvertOptions.
  4. Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().

В следующем примере кода показано, как преобразовать защищенный паролем документ PDF в документ HTML с помощью Java.

// В этом примере кода показано, как преобразовать PDF-файл, защищенный паролем, в HTML.
// Определить параметры загрузки
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();

// Конвертировать
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Преобразование PDF в HTML с водяным знаком в Java

Мы можем конвертировать документы PDF в веб-страницы HTML и добавлять водяные знаки в преобразованные файлы HTML, выполнив следующие действия:

  1. Во-первых, загрузите PDF-документ с помощью класса Converter.
  2. Затем создайте экземпляр класса WatermarkOptions.
  3. Затем установите различные параметры, такие как текст, цвет, ширина, высота, шрифт и т. д.
  4. Затем создайте экземпляр класса MarkupConvertOptions.
  5. После этого назначьте WatermarkOptions для MarkupConvertOptions.
  6. Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().

В следующем примере кода показано, как преобразовать документ PDF в документ HTML с водяным знаком.

// В этом примере кода показано, как преобразовать PDF в HTML с водяным знаком.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");

// Определить водяной знак 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setWatermark(watermark);

// Путь к выходному файлу
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Конвертировать
converter.convert(outputFile, options);
Преобразование PDF в HTML с водяным знаком в Java

Преобразование PDF в HTML с водяным знаком в Java.

Получить бесплатную лицензию

Пожалуйста, попробуйте API без ознакомительных ограничений, запросив бесплатную временную лицензию.

Вывод

В этой статье мы узнали, как конвертировать документы PDF в веб-страницы HTML на Java. Мы также увидели, как преобразовать защищенный паролем PDF-файл в HTML и программно добавить водяной знак в преобразованный файл. Кроме того, вы можете узнать больше о GroupDocs.Conversion for Java API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также