PDF предлагает делиться и печатать документы только для чтения без потери форматирования документов. Мы можем легко конвертировать документы PDF в веб-страницы HTML и просматривать их в любом браузере. В этой статье мы узнаем, как конвертировать документы PDF в веб-страницы HTML с помощью Java.
В этой статье должны быть раскрыты следующие темы:
- Java API для преобразования PDF в HTML — скачать бесплатно
- Преобразование PDF в HTML с использованием Java
- Преобразование диапазона страниц из PDF в HTML
- Преобразование определенных страниц PDF в HTML
- Защищенное паролем преобразование PDF в HTML в Java
- Преобразование PDF в HTML с водяным знаком в Java
Java API для преобразования PDF в HTML — скачать бесплатно
Для преобразования PDF в HTML мы будем использовать GroupDocs.Conversion for Java API. Он предоставляет конечным пользователям быстрые, эффективные и надежные решения для преобразования файлов. Пожалуйста, либо загрузите JAR API, либо просто добавьте следующую конфигурацию pom.xml в приложение Java на основе Maven.
<repository>
<id>GroupDocsJavaAPI</id>
<name>GroupDocs Java API</name>
<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion</artifactId>
<version>21.10.1</version>
</dependency>
Преобразование PDF в HTML с использованием Java
Мы можем легко программно конвертировать PDF-документы в веб-страницы HTML, выполнив простые шаги, указанные ниже:
- Во-первых, загрузите PDF-документ с помощью класса Converter.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Затем при необходимости установите различные параметры преобразования, такие как FixedLayout, FixedLayoutShowBorders и т. д.
- Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert(). Он принимает путь к выходному файлу и параметры преобразования в качестве аргументов.
В следующем примере кода показано, как преобразовать документ PDF в веб-страницу HTML с помощью Java.
// В этом примере кода показано, как преобразовать документ PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");
// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setFixedLayout(true);
// Конвертировать
String outputFile = "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Преобразование диапазона страниц из PDF в HTML
Мы можем преобразовать ряд страниц документа PDF в HTML, выполнив следующие действия:
- Во-первых, загрузите PDF-документ с помощью класса Converter.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Затем установите номер страницы, с которой нужно начать преобразование.
- После этого установите количество страниц, чтобы преобразовать общее количество страниц.
- Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().
В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в файл HTML с помощью Java.
// В этом примере кода показано, как преобразовать диапазон страниц PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");
// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setPageNumber(1); // Starting page number
options.setPagesCount(2); // Total number of pages to convert
// Конвертировать
String outputFile = "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);
Преобразование определенных страниц PDF в HTML
Мы можем преобразовать определенные страницы документа PDF в HTML, выполнив следующие действия:
- Во-первых, загрузите PDF-документ с помощью класса Converter.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Затем укажите конкретные номера страниц в списке через запятую для преобразования.
- Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().
В следующем примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML с помощью Java.
// В этом примере кода показано, как преобразовать определенные страницы документа PDF в файл HTML.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");
// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert
// Конвертировать
String outputFile = "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);
Преобразование защищенного паролем PDF в HTML на Java
Мы также можем преобразовать защищенные паролем PDF-документы в веб-страницы HTML, выполнив следующие действия:
- Во-первых, укажите пароль, используя объект класса PdfLoadOptions .
- Затем загрузите PDF-документ с помощью класса Converter с PdfLoadOptions.
- Затем создайте экземпляр класса MarkupConvertOptions.
- Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().
В следующем примере кода показано, как преобразовать защищенный паролем документ PDF в документ HTML с помощью Java.
// В этом примере кода показано, как преобразовать PDF-файл, защищенный паролем, в HTML.
// Определить параметры загрузки
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf", loadOptions);
// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
// Конвертировать
String outputFile = "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Преобразование PDF в HTML с водяным знаком в Java
Мы можем конвертировать документы PDF в веб-страницы HTML и добавлять водяные знаки в преобразованные файлы HTML, выполнив следующие действия:
- Во-первых, загрузите PDF-документ с помощью класса Converter.
- Затем создайте экземпляр класса WatermarkOptions.
- Затем установите различные параметры, такие как текст, цвет, ширина, высота, шрифт и т. д.
- Затем создайте экземпляр класса MarkupConvertOptions.
- После этого назначьте WatermarkOptions для MarkupConvertOptions.
- Наконец, конвертируйте PDF в HTML, используя метод Converter.Convert().
В следующем примере кода показано, как преобразовать документ PDF в документ HTML с водяным знаком.
// В этом примере кода показано, как преобразовать PDF в HTML с водяным знаком.
// Инициализировать объект класса Конвертировать
Конвертироватьer converter = new Конвертироватьer("C:\\Files\\Conversion\\sample.pdf");
// Определить водяной знак
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);
// Определить параметры преобразования
MarkupКонвертироватьOptions options = new MarkupКонвертироватьOptions();
options.setWatermark(watermark);
// Путь к выходному файлу
String outputFile = "C:\\Files\\Conversion\\sampleWithWatermark.html";
// Конвертировать
converter.convert(outputFile, options);
Получить бесплатную лицензию
Пожалуйста, попробуйте API без ознакомительных ограничений, запросив бесплатную временную лицензию.
Вывод
В этой статье мы узнали, как конвертировать документы PDF в веб-страницы HTML на Java. Мы также увидели, как преобразовать защищенный паролем PDF-файл в HTML и программно добавить водяной знак в преобразованный файл. Кроме того, вы можете узнать больше о GroupDocs.Conversion for Java API, используя документацию. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.