Converti PDF in HTML usando Java

PDF offre la possibilità di condividere e stampare documenti di sola lettura senza perdere la formattazione dei documenti. Possiamo convertire facilmente documenti PDF in pagine Web HTML e visualizzarli in qualsiasi browser. In questo articolo impareremo come convertire documenti PDF in pagine Web HTML utilizzando Java.

In questo articolo verranno trattati i seguenti argomenti:

API Java per convertire PDF in HTML — Download gratuito

Per convertire PDF in HTML, utilizzeremo l’API GroupDocs.Conversion for Java. Fornisce soluzioni di conversione dei file veloci, efficienti e affidabili agli utenti finali. Si prega di scaricare il JAR dell’API o semplicemente aggiungere la seguente configurazione pom.xml in un’applicazione Java basata su Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Conversione da PDF a HTML utilizzando Java

Possiamo convertire facilmente documenti PDF in pagine Web HTML in modo programmatico seguendo i semplici passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions.
  3. Quindi, opzionalmente imposta varie opzioni di conversione come FixedLayout, FixedLayoutShowBorders, ecc.
  4. Infine, converti PDF in HTML usando il metodo Converter.Convert(). Prende il percorso del file di output e converte le opzioni come argomenti.

L’esempio di codice seguente mostra come convertire un documento PDF in una pagina Web HTML utilizzando Java.

// Questo esempio di codice mostra come convertire un documento PDF in un file HTML.
// Inizializza Convertirei oggetto classe
Convertireer converter = new Convertireer("C:\\Files\\Conversion\\sample.pdf");

// Definisci le opzioni di conversione
MarkupConvertireOptions options = new MarkupConvertireOptions();
options.setFixedLayout(true);

// Convertire
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Conversione da PDF a HTML utilizzando Java

Conversione da PDF a HTML utilizzando Java.

Converti intervallo di pagine da PDF a HTML

Possiamo convertire una serie di pagine di un documento PDF in HTML seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions.
  3. Quindi, imposta il numero di pagina da cui iniziare la conversione.
  4. Successivamente, imposta il conteggio delle pagine per convertire il numero totale di pagine.
  5. Infine, converti PDF in HTML usando il metodo Converter.Convert().

L’esempio di codice seguente mostra come convertire un intervallo di pagine da un documento PDF in un file HTML utilizzando Java.

// Questo esempio di codice mostra come convertire un intervallo di pagine PDF in file HTML.
// Inizializza Convertirei oggetto classe
Convertireer converter = new Convertireer("C:\\Files\\Conversion\\sample.pdf");

// Definisci le opzioni di conversione
MarkupConvertireOptions options = new MarkupConvertireOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Convertire
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Converti pagine specifiche di PDF in HTML

Possiamo convertire pagine specifiche di un documento PDF in HTML seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions.
  3. Quindi, fornisci numeri di pagina specifici in un elenco separato da virgole da convertire.
  4. Infine, converti PDF in HTML usando il metodo Converter.Convert().

L’esempio di codice seguente mostra come convertire pagine specifiche di un documento PDF in un file HTML utilizzando Java.

// Questo esempio di codice mostra come convertire pagine specifiche di un documento PDF in file HTML.
// Inizializza Convertirei oggetto classe
Convertireer converter = new Convertireer("C:\\Files\\Conversion\\sample.pdf");

// Definisci le opzioni di conversione
MarkupConvertireOptions options = new MarkupConvertireOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Convertire
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Converti PDF protetto da password in HTML in Java

Possiamo anche convertire documenti PDF protetti da password in pagine Web HTML seguendo i passaggi indicati di seguito:

  1. In primo luogo, fornire la password utilizzando l’oggetto classe PdfLoadOptions .
  2. Quindi, carica un documento PDF utilizzando la classe Converter con PdfLoadOptions.
  3. Quindi, crea un’istanza della classe MarkupConvertOptions.
  4. Infine, converti PDF in HTML usando il metodo Converter.Convert().

L’esempio di codice seguente mostra come convertire un documento PDF protetto da password in un documento HTML utilizzando Java.

// Questo esempio di codice mostra come convertire i PDF protetti da password in HTML.
// Definisci le opzioni di carico
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Inizializza Convertirei oggetto classe
Convertireer converter = new Convertireer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Definisci le opzioni di conversione
MarkupConvertireOptions options = new MarkupConvertireOptions();

// Convertire
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Conversione da PDF a HTML con filigrana in Java

Possiamo convertire documenti PDF in pagine Web HTML e aggiungere filigrane ai file HTML convertiti seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter.
  2. Quindi, crea un’istanza della classe WatermarkOptions.
  3. Quindi, imposta varie opzioni come Testo, Colore, Larghezza, Altezza, Carattere, ecc.
  4. Quindi, crea un’istanza della classe MarkupConvertOptions.
  5. Successivamente, assegna WatermarkOptions a MarkupConvertOptions.
  6. Infine, converti PDF in HTML usando il metodo Converter.Convert().

L’esempio di codice seguente mostra come convertire un documento PDF in un documento HTML con una filigrana.

// Questo esempio di codice mostra come convertire un PDF in HTML con filigrana.
// Inizializza Convertirei oggetto classe
Convertireer converter = new Convertireer("C:\\Files\\Conversion\\sample.pdf");

// Definisci filigrana 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Definisci le opzioni di conversione
MarkupConvertireOptions options = new MarkupConvertireOptions();
options.setWatermark(watermark);

// Percorso del file di output
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Convertire
converter.convert(outputFile, options);
Conversione da PDF a HTML con filigrana in Java

Conversione da PDF a HTML con filigrana in Java.

Ottieni una licenza gratuita

Prova l’API senza limitazioni di valutazione richiedendo una licenza temporanea gratuita.

Conclusione

In questo articolo, abbiamo imparato come convertire documenti PDF in pagine Web HTML in Java. Abbiamo anche visto come convertire un file PDF protetto da password in HTML e aggiungere una filigrana al file convertito in modo programmatico. Inoltre, puoi saperne di più sull’API GroupDocs.Conversion per Java utilizzando la documentazione. In caso di ambiguità, non esitare a contattarci sul forum.

Guarda anche