Converti HTML in Word usando Java

Converti HTML in Word usando Java

Questo post del blog ti insegnerà come convertire HTML in Word usando Java in modo programmatico. Fortunatamente, questa libreria Java offre elaborazione, manipolazione e conversioni di file istantanee. Puoi installare questa libreria facilmente senza dipendenze esterne. Inoltre, è disponibile una documentazione completa per quanto riguarda l’installazione e l’utilizzo. I documenti di Microsoft Word sono i formati di file più utilizzati al momento. Pertanto, dimostreremo passo dopo passo il processo di conversione da HTML a Word.

Tratteremo i seguenti punti:

Converti HTML in Word utilizzando Java - Installazione API

Questa libreria Java DOCX fornisce un’enorme pila di funzionalità che potenziano i processi di conversione dei file. Ti dà il controllo sulle attività di manipolazione di dati e file. Per abilitare questa libreria nella tua applicazione Java, scarica i file jar oppure puoi seguire le seguenti configurazioni Maven.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Dipendenza

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Come convertire una pagina Web in Word a livello di codice

La conversione di una pagina HTML in un documento Word a livello di codice è semplicissima. È possibile ottenere questa funzionalità seguendo un paio di passaggi indicati di seguito.

  1. Crea un’istanza della classe Document e carica un file HTML di origine.
  2. Chiama il metodo save(java.lang.String fileName, int saveFormat) per salvare il file in formato DOCX.

Copia e incolla il seguente codice nel tuo file Java per convertire il file HTML in un file Word.

// creare un'istanza della classe Document e caricare un file HTML di origine
Document document = new Document("index.html");
// chiama il metodo save(java.lang.String fileName, int saveFormat) per salvare il file in formato DOCX
document.save("output.docx", SaveFormat.DOCX);

Libreria del convertitore da HTML a Word - Funzionalità avanzate

In questa sezione esploreremo le funzionalità avanzate come l’impostazione della qualità del documento, l’impostazione di una password e altro ancora.

Puoi seguire i seguenti passaggi e i frammenti di codice per conoscere ulteriori metodi:

  1. Crea un’istanza della classe Document e carica un file HTML di origine.
  2. Il metodo protect(int type, java.lang.String password) ti consentirà di impostare una password per proteggere il documento da eventuali modifiche.
  3. unprotect() rimuoverà la password.
  4. Imposta questo metodo setTrackRevisions True se le modifiche vengono tracciate quando questo documento viene modificato in Microsoft Word.
  5. Gli errori di ortografia verranno evidenziati se il metodo setShowSpllingErrors è True.
  6. Il metodo setShowGramticalErrors evidenzierà gli errori grammaticali se True.
  7. removeAllChildren rimuove tutti i nodi figlio del nodo corrente.
  8. Istanziare un’istanza della classe DocSaveOptions.
  9. Richiamare il metodo setUseHighQualityRendering per impostare un valore che determina se utilizzare o meno algoritmi di rendering di alta qualità (cioè lenti).
  10. Chiamare il metodo save(java.lang.String fileName, int saveFormat) per salvare il file in formato DOCX.
        // creare un'istanza della classe Document e caricare un file HTML di origine
        Document document = new Document("index.html");
        // protect(int type, java.lang.String password) ti consentirà di impostare una password per proteggere il documento da eventuali modifiche
        document.protect(1,"password");
        // unprotect() rimuoverà la password
        document.unprotect();
        // imposta questo metodo setTrackRevisions True se le modifiche vengono tracciate quando questo documento viene modificato in Microsoft Word.
        document.setTrackRevisions(true);
        // gli errori di ortografia verranno evidenziati se il metodo setShowSpllingErrors è True
        document.setShowSpellingErrors(true);
        // Il metodo setShowGramticalErrors evidenzierà gli errori grammaticali se True
        document.setShowGrammaticalErrors(true);
        // removeAllChildren rimuove tutti i nodi figlio del nodo corrente.
        document.removeAllChildren();
        // istanziare un'istanza della classe DocSaveOptions
        DocSaveOptions opt = new DocSaveOptions();
        // invocare il metodo setUseHighQualityRendering per impostare un valore che determina se utilizzare o meno algoritmi di rendering di alta qualità (cioè lenti).
        opt.setUseHighQualityRendering(true);
        // chiama il metodo save(java.lang.String fileName, int saveFormat) per salvare il file in formato DOCX
        document.save("output.docx", SaveFormat.DOCX);

Ottieni una licenza gratuita

Puoi ottenere una licenza temporanea gratuita per provare l’API senza limitazioni di valutazione.

Riassumendo

Questo ci porta alla fine di questo post sul blog. Abbiamo spiegato come convertire HTML in Word usando Java a livello di codice. Inoltre, puoi trovare i frammenti di codice della funzionalità menzionata nelle sezioni precedenti. Inoltre, puoi visitare la documentazione per le altre funzionalità che possono essere utili per il tuo convertitore da HTML a Word. Infine, conholdate.com sta scrivendo nuovi post sul blog su altri argomenti. Pertanto, si prega di rimanere in contatto per aggiornamenti regolari.

Fai una domanda

Puoi condividere le tue domande o domande sul nostro forum.

Guarda anche