Konwertuj pliki PDF na HTML za pomocą Java

PDF umożliwia udostępnianie i drukowanie dokumentów tylko do odczytu bez utraty formatowania dokumentów. Z łatwością możemy konwertować dokumenty PDF na strony internetowe HTML i przeglądać je w dowolnej przeglądarce. W tym artykule dowiemy się, jak konwertować dokumenty PDF na strony internetowe HTML za pomocą języka Java.

W tym artykule zostaną omówione następujące tematy:

Interfejs API Java do konwersji plików PDF na HTML — bezpłatne pobieranie

Do konwersji plików PDF na HTML użyjemy API GroupDocs.Conversion for Java. Zapewnia szybkie, wydajne i niezawodne rozwiązania do konwersji plików dla użytkowników końcowych. Proszę pobierz plik JAR interfejsu API lub po prostu dodaj następującą konfigurację pom.xml w aplikacji Java opartej na Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Konwersja plików PDF do HTML przy użyciu języka Java

Możemy łatwo programowo konwertować dokumenty PDF na strony HTML, wykonując proste kroki podane poniżej:

  1. Najpierw załaduj dokument PDF przy użyciu klasy Converter.
  2. Następnie utwórz instancję klasy MarkupConvertOptions.
  3. Następnie opcjonalnie ustaw różne opcje konwersji, takie jak FixLayout, FixLayoutShowBorders itp.
  4. Na koniec przekonwertuj plik PDF na HTML za pomocą metody Converter.Convert(). Pobiera ścieżkę pliku wyjściowego i konwertuje opcje jako argumenty.

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument PDF na stronę internetową HTML przy użyciu języka Java.

// Ten przykład kodu demonstruje, jak przekonwertować dokument PDF na plik HTML.
// Zainicjuj obiekt klasy Konwertować
Konwertowaćer converter = new Konwertowaćer("C:\\Files\\Conversion\\sample.pdf");

// Zdefiniuj opcje konwersji
MarkupKonwertowaćOptions options = new MarkupKonwertowaćOptions();
options.setFixedLayout(true);

// Konwertować
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Konwersja plików PDF do HTML przy użyciu języka Java

Konwersja plików PDF do HTML przy użyciu języka Java.

Konwertuj zakres stron z formatu PDF na HTML

Możemy przekonwertować zakres stron dokumentu PDF na HTML, wykonując poniższe czynności:

  1. Najpierw załaduj dokument PDF przy użyciu klasy Converter.
  2. Następnie utwórz instancję klasy MarkupConvertOptions.
  3. Następnie ustaw numer strony, od której chcesz rozpocząć konwersję.
  4. Następnie ustaw liczbę stron, aby przekonwertować całkowitą liczbę stron.
  5. Na koniec przekonwertuj plik PDF na HTML za pomocą metody Converter.Convert().

Poniższy przykładowy kod pokazuje, jak przekonwertować zakres stron z dokumentu PDF na plik HTML przy użyciu języka Java.

// Ten przykład kodu demonstruje, jak przekonwertować zakres stron PDF na plik HTML.
// Zainicjuj obiekt klasy Konwertować
Konwertowaćer converter = new Konwertowaćer("C:\\Files\\Conversion\\sample.pdf");

// Zdefiniuj opcje konwersji
MarkupKonwertowaćOptions options = new MarkupKonwertowaćOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Konwertować
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Konwertuj określone strony pliku PDF na HTML

Możemy przekonwertować określone strony dokumentu PDF na HTML, wykonując poniższe czynności:

  1. Najpierw załaduj dokument PDF przy użyciu klasy Converter.
  2. Następnie utwórz instancję klasy MarkupConvertOptions.
  3. Następnie podaj konkretne numery stron na liście oddzielonej przecinkami, które chcesz przekonwertować.
  4. Na koniec przekonwertuj plik PDF na HTML za pomocą metody Converter.Convert().

Poniższy przykładowy kod pokazuje, jak przekonwertować określone strony dokumentu PDF na plik HTML przy użyciu języka Java.

// Ten przykład kodu demonstruje, jak przekonwertować określone strony dokumentu PDF na plik HTML.
// Zainicjuj obiekt klasy Konwertować
Konwertowaćer converter = new Konwertowaćer("C:\\Files\\Conversion\\sample.pdf");

// Zdefiniuj opcje konwersji
MarkupKonwertowaćOptions options = new MarkupKonwertowaćOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Konwertować
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Konwertuj chronione hasłem pliki PDF na HTML w Javie

Możemy również konwertować dokumenty PDF chronione hasłem na strony internetowe HTML, wykonując poniższe czynności:

  1. Najpierw podaj hasło za pomocą obiektu klasy PdfLoadOptions .
  2. Następnie załaduj dokument PDF przy użyciu klasy Converter z opcją PdfLoadOptions.
  3. Następnie utwórz instancję klasy MarkupConvertOptions.
  4. Na koniec przekonwertuj plik PDF na HTML za pomocą metody Converter.Convert().

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument PDF chroniony hasłem na dokument HTML przy użyciu języka Java.

// Ten przykład kodu demonstruje, jak przekonwertować plik PDF chroniony hasłem na format HTML.
// Zdefiniuj opcje ładowania
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Zainicjuj obiekt klasy Konwertować
Konwertowaćer converter = new Konwertowaćer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Zdefiniuj opcje konwersji
MarkupKonwertowaćOptions options = new MarkupKonwertowaćOptions();

// Konwertować
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Konwersja plików PDF do HTML ze znakiem wodnym w Javie

Możemy konwertować dokumenty PDF na strony internetowe HTML i dodawać znaki wodne do przekonwertowanych plików HTML, wykonując poniższe czynności:

  1. Najpierw załaduj dokument PDF przy użyciu klasy Converter.
  2. Następnie utwórz instancję klasy WatermarkOptions.
  3. Następnie ustaw różne opcje, takie jak tekst, kolor, szerokość, wysokość, czcionka itp.
  4. Następnie utwórz instancję klasy MarkupConvertOptions.
  5. Następnie przypisz WatermarkOptions do MarkupConvertOptions.
  6. Na koniec przekonwertuj plik PDF na HTML za pomocą metody Converter.Convert().

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument PDF na dokument HTML ze znakiem wodnym.

// Ten przykład kodu demonstruje, jak przekonwertować plik PDF na HTML ze znakiem wodnym.
// Zainicjuj obiekt klasy Konwertować
Konwertowaćer converter = new Konwertowaćer("C:\\Files\\Conversion\\sample.pdf");

// Zdefiniuj znak wodny 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Zdefiniuj opcje konwersji
MarkupKonwertowaćOptions options = new MarkupKonwertowaćOptions();
options.setWatermark(watermark);

// Ścieżka pliku wyjściowego
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Konwertować
converter.convert(outputFile, options);
Konwersja plików PDF do HTML ze znakiem wodnym w Javie

Konwersja plików PDF do HTML ze znakiem wodnym w Javie.

Zdobądź bezpłatną licencję

Wypróbuj interfejs API bez ograniczeń ewaluacyjnych, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule dowiedzieliśmy się, jak konwertować dokumenty PDF na strony internetowe HTML w Javie. Widzieliśmy także, jak przekonwertować plik PDF chroniony hasłem na format HTML i programowo dodać znak wodny do przekonwertowanego pliku. Poza tym możesz dowiedzieć się więcej o GroupDocs.Conversion for Java API, korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też