Konwertuj Word DOCX na HTML w Javie

Konwertuj Word na HTML w Javie

Ten post na blogu jest dla Ciebie, jeśli chcesz opracować konwerter stron internetowych Word DOCX na HTML dla swojej aplikacji biznesowej. Możesz zainstalować tę [bibliotekę] Java Word bibliotekę, aby konwertować pliki Docx na inne popularne formaty, takie jak HTML, PNG, PDF i inne. Jednak pod koniec tego samouczka powinieneś już dobrze znać tę bibliotekę Java do konwersji plików. Dlatego zacznijmy artykuł i dowiedzmy się, jak programowo przekonwertować Word na HTML w Javie.

Omówione zostaną następujące punkty:

Instalacja biblioteki konwertera Java Word DOCX Converter

Proces instalacji tej biblioteki jest bardzo przyjazny dla programistów, ponieważ dostępna jest obszerna dokumentacja dotycząca programowania i instalacji. Możesz więc pobrać plik JAR lub zainstalować tę bibliotekę, korzystając z następujących konfiguracji Mavena.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Konwertuj Word DOCX na HTML w Javie

Wszystko jest gotowe do pisania kodu źródłowego w aplikacji Java w celu programowego zbudowania konwertera Word na HTML.

Poniżej przedstawiono kroki konwersji programu Word na HTML w Javie:

  1. Utwórz instancję klasy Document i załaduj źródłowy plik Word.
  2. Zainicjuj obiekt klasy HtmlSaveOptions, aby określić dodatkowe opcje podczas zapisywania dokumentu w formatach HTML.
  3. Wywołaj setExportRoundtripInformation, aby określić, czy podczas zapisywania w formacie HTML mają być zapisywane informacje o podróży w obie strony.
  4. Jeżeli wartość metody setExportFontResources ma wartość true, zasoby czcionek zostaną wyeksportowane do formatu HTML.
  5. Wywołaj metodę setExportFontsAsBase64, aby określić, czy zasoby czcionek powinny być osadzone w HTML w kodowaniu Base64.
  6. Teraz metoda save zapisze dokument Worda w formacie HTML.

Skopiuj i wklej następujący kod do pliku głównego, aby przekonwertować dokument DOCX na stronę internetową HTML w Javie:

// Utwórz instancję klasy Document i załaduj źródłowy plik Word. 
Document doc = new Document(  "sample.doc");
// Zainicjuj obiekt klasy HtmlSaveOptions, aby określić dodatkowe opcje podczas zapisywania dokumentu w formatach HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Wywołaj setExportRoundtripInformation, aby określić, czy podczas zapisywania w formacie HTML mają być zapisywane informacje o podróży w obie strony.
options.setExportRoundtripInformation(true);
// Jeżeli wartość metody setExportFontResources ma wartość true, zasoby czcionek zostaną wyeksportowane do formatu HTML.
options.setExportFontResources(true);
// Wywołaj metodę setExportFontsAsBase64, aby określić, czy zasoby czcionek powinny być osadzone w formacie HTML w kodowaniu Base64.
options.setExportFontsAsBase64(true);
// Teraz metoda zapisu zapisze dokument programu Word w formacie HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

Wynik można zobaczyć na obrazku poniżej:

słowo DOCX do HTML Java

Zdobądź bezpłatną licencję

Możesz skorzystać z bezpłatnej licencji tymczasowej, aby wypróbować interfejs API bez ograniczeń ewaluacyjnych.

Podsumowując

Na tym możemy zakończyć ten wpis na blogu. Mamy nadzieję, że podobał Ci się ten artykuł i dowiedziałeś się, jak programowo przekonwertować Word DOCX na HTML w Javie. Ta biblioteka Java Word udostępnia wiele innych funkcji, więc nie zapomnij odwiedzić dokumentacji.

Ponadto sugerujemy skorzystanie z naszego Przewodnika wprowadzającego.

Wreszcie conholdate.com pisze nowe posty na blogu. Dlatego prosimy o kontakt w celu otrzymywania regularnych aktualizacji.

Zadać pytanie

Możesz dać nam znać o swoich pytaniach lub wątpliwościach na naszym forum.

Często zadawane pytania

Jak przekonwertować plik DOCX na HTML?

Utwórz instancję klasy Document, załaduj źródłowy plik Word i wywołaj metodę save, aby zapisać plik Word DOCX w formacie HTML.

Zobacz też