Converti Word in HTML in Java

Converti Word in HTML in Java

Questo post del blog fa per te se desideri sviluppare un convertitore da Word a HTML per la tua applicazione aziendale. Puoi installare questa libreria Java Word per convertire i file Docx in altri formati popolari come HTML, PNG, PDF e altri. Tuttavia, alla fine di questo tutorial, dovresti avere una buona conoscenza di questa libreria Java per la conversione di file. Pertanto, iniziamo l’articolo e impariamo come convertire Word in HTML in Java a livello di codice.

Verranno trattati i seguenti punti:

Installazione della libreria Java Word

Il processo di installazione di questa libreria è molto intuitivo per gli sviluppatori poiché trovi una documentazione completa relativa allo sviluppo e all’installazione. Quindi, puoi scaricare il file JAR o installare questa libreria utilizzando le seguenti configurazioni Maven.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Converti Word in HTML in Java

Sei pronto per scrivere il codice sorgente nella tua applicazione Java per creare un convertitore da Word a HTML a livello di codice.

Di seguito sono riportati i passaggi per convertire Word in HTML:

  1. Crea un’istanza della classe Document e carica il file Word di origine.
  2. Inizializza un oggetto della classe HtmlSaveOptions per specificare opzioni aggiuntive durante il salvataggio di un documento nei formati HTML.
  3. Richiamare setExportRoundtripInformation per specificare se scrivere le informazioni di andata e ritorno durante il salvataggio in HTML.
  4. Se il valore del metodo setExportFontResources è true, le risorse dei font verranno esportate in HTML.
  5. Chiamare il metodo setExportFontsAsBase64 per specificare se le risorse dei caratteri devono essere incorporate in HTML nella codifica Base64.
  6. Ora, il metodo save salverà il documento Word nel formato HTML.

Copia e incolla il seguente codice nel tuo file principale:

// Creare un'istanza della classe Document e caricare il file Word di origine. 
Document doc = new Document(  "sample.doc");
// Inizializza un oggetto della classe HtmlSaveOptions per specificare opzioni aggiuntive durante il salvataggio di un documento nei formati HTML.  
HtmlSaveOptions options = new HtmlSaveOptions();
// Richiamare setExportRoundtripInformation per specificare se scrivere le informazioni di andata e ritorno durante il salvataggio in HTML.
options.setExportRoundtripInformation(true);
// Se il valore del metodo setExportFontResources è true, le risorse dei caratteri verranno esportate in HTML.
options.setExportFontResources(true);
// Chiamare il metodo setExportFontsAsBase64 per specificare se le risorse dei caratteri devono essere incorporate in HTML nella codifica Base64.
options.setExportFontsAsBase64(true);
// Ora, il metodo di salvataggio salverà il documento Word nel formato HTML.  
doc.save("Document_out.html", SaveFormat.HTML);

L’output può essere visto nell’immagine qui sotto:

parola in html

Ottieni una licenza gratuita

Puoi usufruire di una licenza temporanea gratuita per provare l’API senza limiti di valutazione.

Riassumendo

Possiamo terminare questo post sul blog qui. Spero che l’articolo ti sia piaciuto e che tu abbia imparato a convertire Word in HTML in Java a livello di programmazione. Ci sono molte altre funzionalità esposte da questa libreria Java Word, quindi non dimenticare di visitare la documentazione.

Inoltre, ti suggeriamo di seguire la nostra Guida introduttiva.

Infine, conholdate.com sta scrivendo nuovi post sul blog. Quindi, resta in contatto per aggiornamenti regolari.

Fai una domanda

Puoi farci sapere le tue domande o domande sul nostro forum.

Domande frequenti

Come posso convertire un DOCX in HTML?

Crea un’istanza della classe Document e carica il file Word di origine, quindi chiama il metodo save per salvare il file Word in formato HTML.

Guarda anche