
Konwertuj Word na HTML w Javie
Ten post na blogu jest dla Ciebie, jeśli chcesz opracować konwerter stron internetowych Word DOCX na HTML dla swojej aplikacji biznesowej. Możesz zainstalować tę [bibliotekę] Java Word bibliotekę, aby konwertować pliki Docx na inne popularne formaty, takie jak HTML, PNG, PDF i inne. Jednak pod koniec tego samouczka powinieneś już dobrze znać tę bibliotekę Java do konwersji plików. Dlatego zacznijmy artykuł i dowiedzmy się, jak programowo przekonwertować Word na HTML w Javie.
Omówione zostaną następujące punkty:
Instalacja biblioteki konwertera Java Word DOCX Converter
Proces instalacji tej biblioteki jest bardzo przyjazny dla programistów, ponieważ dostępna jest obszerna dokumentacja dotycząca programowania i instalacji. Możesz więc pobrać plik JAR lub zainstalować tę bibliotekę, korzystając z następujących konfiguracji Mavena.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.10</version>
<classifier>jdk17</classifier>
</dependency>
Konwertuj Word DOCX na HTML w Javie
Wszystko jest gotowe do pisania kodu źródłowego w aplikacji Java w celu programowego zbudowania konwertera Word na HTML.
Poniżej przedstawiono kroki konwersji programu Word na HTML w Javie:
- Utwórz instancję klasy Document i załaduj źródłowy plik Word.
- Zainicjuj obiekt klasy HtmlSaveOptions, aby określić dodatkowe opcje podczas zapisywania dokumentu w formatach HTML.
- Wywołaj setExportRoundtripInformation, aby określić, czy podczas zapisywania w formacie HTML mają być zapisywane informacje o podróży w obie strony.
- Jeżeli wartość metody setExportFontResources ma wartość true, zasoby czcionek zostaną wyeksportowane do formatu HTML.
- Wywołaj metodę setExportFontsAsBase64, aby określić, czy zasoby czcionek powinny być osadzone w HTML w kodowaniu Base64.
- Teraz metoda save zapisze dokument Worda w formacie HTML.
Skopiuj i wklej następujący kod do pliku głównego, aby przekonwertować dokument DOCX na stronę internetową HTML w Javie:
// Utwórz instancję klasy Document i załaduj źródłowy plik Word.
Document doc = new Document( "sample.doc");
// Zainicjuj obiekt klasy HtmlSaveOptions, aby określić dodatkowe opcje podczas zapisywania dokumentu w formatach HTML.
HtmlSaveOptions options = new HtmlSaveOptions();
// Wywołaj setExportRoundtripInformation, aby określić, czy podczas zapisywania w formacie HTML mają być zapisywane informacje o podróży w obie strony.
options.setExportRoundtripInformation(true);
// Jeżeli wartość metody setExportFontResources ma wartość true, zasoby czcionek zostaną wyeksportowane do formatu HTML.
options.setExportFontResources(true);
// Wywołaj metodę setExportFontsAsBase64, aby określić, czy zasoby czcionek powinny być osadzone w formacie HTML w kodowaniu Base64.
options.setExportFontsAsBase64(true);
// Teraz metoda zapisu zapisze dokument programu Word w formacie HTML.
doc.save("Document_out.html", SaveFormat.HTML);
Wynik można zobaczyć na obrazku poniżej:

Zdobądź bezpłatną licencję
Możesz skorzystać z bezpłatnej licencji tymczasowej, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.
Podsumowując
Na tym możemy zakończyć ten wpis na blogu. Mamy nadzieję, że podobał Ci się ten artykuł i dowiedziałeś się, jak programowo przekonwertować Word DOCX na HTML w Javie. Ta biblioteka Java Word udostępnia wiele innych funkcji, więc nie zapomnij odwiedzić dokumentacji.
Ponadto sugerujemy skorzystanie z naszego Przewodnika wprowadzającego.
Wreszcie conholdate.com pisze nowe posty na blogu. Dlatego prosimy o kontakt w celu otrzymywania regularnych aktualizacji.
Zadać pytanie
Możesz dać nam znać o swoich pytaniach lub wątpliwościach na naszym forum.
Często zadawane pytania
Jak przekonwertować plik DOCX na HTML?
Utwórz instancję klasy Document, załaduj źródłowy plik Word i wywołaj metodę save, aby zapisać plik Word DOCX w formacie HTML.