Konwertuj pliki PDF na Word za pomocą Java

Możesz łatwo konwertować dokumenty PDF na dokumenty programu Word (.docx lub .doc) programowo w aplikacjach Java. Taka konwersja jest przydatna, gdy zachodzi potrzeba edycji tekstu dokumentów PDF lub może być konieczne zastosowanie formatowania tekstu. W tym artykule dowiesz się, jak przekonwertować plik PDF na Word za pomocą Java.

W tym artykule omówiono/omówiono następujące tematy:

API Java do konwersji plików PDF na Word

Będę używać GroupDocs.Conversion for Java API do konwersji PDF na DOCX. Ten interfejs API zapewnia szybkie, wydajne i niezawodne rozwiązanie do konwersji plików do aplikacji Java bez konieczności instalowania zewnętrznego oprogramowania. Obsługuje konwersje pomiędzy wszystkimi popularnymi formatami dokumentów biznesowych, takimi jak PDF, HTML, e-mail, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, formaty plików obrazów rastrowych i wiele innych. Pozwala także wyświetlić cały dokument lub wyrenderować go częściowo, aby przyspieszyć proces. API jest kompatybilne ze wszystkimi wersjami Java i obsługuje popularne systemy operacyjne (Windows, Linux, macOS), w których można uruchomić środowisko wykonawcze Java.

Pobierz i skonfiguruj

Możesz pobrać plik JAR interfejsu API lub po prostu dodać następującą konfigurację pom.xml do swojej aplikacji Java opartej na Maven, aby wypróbować poniższe przykłady kodu.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Konwertuj pliki PDF na Word za pomocą Java

Możesz przekonwertować dokumenty PDF na Word, wykonując proste kroki podane poniżej:

  1. Utwórz instancję klasy Converter.
  2. Podaj ścieżkę pliku wejściowego
  3. Utwórz instancję WordProcessingConvertOptions
  4. Ustaw numer strony początkowej
  5. Podaj całkowitą liczbę stron do konwersji
  6. Ustaw format pliku wyjściowego
  7. Wywołaj metodę Convert() wraz ze ścieżką do pliku wyjściowego i opcjami konwersji

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na dokument programu Word przy użyciu języka Java.

// utwórz konwerter
Converter konwertowaćer = new Converter("C:\\Files\\sample.pdf");

// ustaw opcje konwersji programu Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// konwertować
konwertowaćer.konwertować("C:\\Files\\output.docx", options);
Konwertuj pliki PDF na Word za pomocą Java

Konwertuj pliki PDF na Word za pomocą Java

Klasa Converter jest klasą główną kontrolującą proces konwersji dokumentu. Zapewnia różne metody konwersji dokumentów w obsługiwanych formatach plików. Metoda Convert() tej klasy konwertuje dokumenty źródłowe i przyjmuje dwa parametry wejściowe: ścieżkę pliku do dokumentu źródłowego oraz metodę ConvertOptions, która konwertuje określony dokument źródłowy na żądany docelowy typ pliku.

Klasa WordProcessingConvertOptions udostępnia opcje konwersji do typu pliku WordProcessing. Metoda setPageNumber() umożliwia ustawienie numeru strony początkowej, od której rozpocznie się konwersja. Natomiast metoda setPagesCount() określa całkowitą liczbę stron do konwersji począwszy od zdefiniowanego numeru strony. Metoda setFormat() tej klasy umożliwia ustawienie formatu wyjściowego konwertowanego dokumentu. Jako dane wejściowe pobiera typ wyliczeniowy WordProcessingFileType.

Konwertuj określone strony pliku PDF na Word

Możesz przekonwertować określone strony dokumentu PDF na Word, wykonując proste kroki podane poniżej:

  1. Utwórz instancję klasy Converter.
  2. Podaj ścieżkę pliku wejściowego
  3. Utwórz instancję WordProcessingConvertOptions
  4. Ustaw listę numerów stron do konwersji
  5. Wywołaj metodę Convert() wraz ze ścieżką do pliku wyjściowego i opcjami konwersji

Poniższy przykładowy kod pokazuje, jak przekonwertować określone strony z pliku PDF na dokument programu Word przy użyciu języka Java.

// utwórz konwerter
Converter konwertowaćer = new Converter("C:\\Files\\sample.pdf");

// zdefiniuj opcje konwersji programu Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// konwertować
konwertowaćer.konwertować("C:\\Files\\output.docx", options);

Klasa WordProcessingConvertOptions udostępnia metodę setPages() służącą do konwersji określonych numerów stron zdefiniowanych na liście rozdzielanej przecinkami z dokumentu źródłowego.

Załaduj plik PDF chroniony hasłem i skonwertuj go do formatu Word

Możesz przekonwertować dokumenty PDF chronione hasłem do programu Word, wykonując proste kroki podane poniżej:

  1. Utwórz PdfLoadOptions
  2. Ustaw hasło
  3. Utwórz instancję klasy Converter.
  4. Podaj ścieżkę pliku wejściowego
  5. Utwórz instancję WordProcessingConvertOptions
  6. Wywołaj metodę Convert() wraz ze ścieżką do pliku wyjściowego i opcjami konwersji

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF chroniony hasłem na dokument programu Word przy użyciu języka Java.

// Opcje ładowania PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// utwórz konwerter
Converter konwertowaćer = new Converter("C:\\Files\\sample.pdf", loadOptions);

// zdefiniuj opcje konwersji programu Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// konwertować
konwertowaćer.konwertować("C:\\Files\\output.docx", options);

Klasa PdfLoadOptions udostępnia różne opcje ładowania dokumentów PDF. Metoda setPassword() tej klasy umożliwia wyłączenie ochrony chronionego dokumentu poprzez podanie jego hasła.

Więcej szczegółów na temat „[Wczytaj dokument PDF z opcjami]" 17 można znaleźć w dokumentacji.

Zdobądź bezpłatną licencję

Możesz wypróbować interfejs API bez ograniczeń ewaluacyjnych, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule dowiedziałeś się, jak konwertować dokumenty PDF do programu Word przy użyciu języka Java. Nauczyłeś się także, jak przekonwertować plik PDF chroniony hasłem na dokument programu Word. Co więcej, nauczyłeś się programowo konwertować określone strony z pliku PDF do dokumentu programu Word. Możesz dowiedzieć się jeszcze więcej o API GroupDocs.Conversion Java korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też