Converti PDF in HTML usando C#

PDF è il formato più diffuso per la condivisione e la stampa di documenti. In alcuni casi, potrebbe essere necessario convertire i documenti PDF in pagine Web HTML. Tale conversione aiuta a condividere il contenuto dei documenti PDF in modo che le parti interessate possano visualizzarli facilmente in qualsiasi browser. In questo articolo impareremo come convertire documenti PDF in pagine Web HTML utilizzando C#.

In questo articolo verranno trattati i seguenti argomenti:

API C# per convertire PDF in HTML — Download gratuito

Utilizzeremo l’API GroupDocs.Conversion for .NET per convertire PDF in HTML. Fornisce soluzioni di conversione dei file veloci, efficienti e affidabili agli utenti finali. Si prega di scaricare la DLL dell’API o installarla utilizzando NuGet.

Install-Package GroupDocs.Conversion

Conversione da PDF a HTML utilizzando C#

Possiamo convertire facilmente documenti PDF in pagine Web HTML in modo programmatico seguendo i semplici passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter con il percorso del file di input come argomento. È la classe principale che controlla il processo di conversione del documento.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions. Fornisce varie opzioni per la conversione in tipi di file di markup.
  3. Quindi, opzionalmente imposta varie opzioni di conversione come FixedLayout, FixedLayoutShowBorders, ecc.
  4. Infine, chiama il metodo Converter.Convert() per salvare il file HTML convertito. Questo metodo prende il percorso del file di output e converte le opzioni come argomento.

L’esempio di codice seguente mostra come convertire un documento PDF in una pagina Web HTML usando C#.

// Carica il file PDF di origine
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Imposta le opzioni di conversione per il formato HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Converti in formato HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Converti PDF in HTML in C#.

Converti PDF in HTML in C#.

Converti intervallo di pagine da PDF a HTML

Possiamo convertire una serie di pagine di un documento PDF in HTML in modo programmatico seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter con il percorso del file di input come argomento.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions.
  3. Quindi, imposta il numero di pagina da cui iniziare la conversione
  4. Successivamente, imposta il conteggio delle pagine per convertire il numero totale di pagine
  5. Infine, chiama il metodo Converter.Convert() con il percorso del file di output e converti le opzioni per salvare il file HTML convertito.

L’esempio di codice seguente mostra come convertire un intervallo di pagine da un documento PDF in un file HTML in C#.

// Carica il file PDF di origine
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Imposta le opzioni di conversione per il formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Converti in formato HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Converti pagine specifiche di PDF in HTML

Possiamo convertire pagine specifiche di un documento PDF in HTML seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter con il percorso del file di input come argomento.
  2. Quindi, crea un’istanza della classe MarkupConvertOptions.
  3. Quindi, fornisci numeri di pagina specifici in un elenco separato da virgole da convertire.
  4. Infine, chiama il metodo Converter.Convert() con il percorso del file di output e converti le opzioni per salvare il file HTML convertito.

L’esempio di codice seguente mostra come convertire pagine specifiche di un documento PDF in un file HTML in C#.

// Carica il file PDF di origine
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Imposta le opzioni di conversione per il formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Converti in formato HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Conversione da PDF a HTML con filigrana in C#

Possiamo convertire documenti PDF in pagine Web HTML e aggiungere filigrane ai file HTML convertiti in modo programmatico seguendo i passaggi indicati di seguito:

  1. Innanzitutto, carica un documento PDF utilizzando la classe Converter con il percorso del file di input come argomento.
  2. Quindi, crea un’istanza della classe WatermarkOptions.
  3. Quindi, imposta varie opzioni come Testo, Colore, Larghezza, Altezza, Carattere, ecc.
  4. Quindi, crea un’istanza della classe MarkupConvertOptions.
  5. Successivamente, assegna WatermarkOptions a MarkupConvertOptions.
  6. Infine, chiama il metodo Converter.Convert() con il percorso del file di output e converti le opzioni per salvare il file HTML convertito.

L’esempio di codice seguente mostra come convertire un documento PDF in un documento HTML con una filigrana.

// Carica il file PDF di origine
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Definisci filigrana di testo
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Imposta le opzioni di conversione per il formato HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Converti in formato HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Conversione da PDF a HTML con filigrana in C#.

Conversione da PDF a HTML con filigrana in C#.

Ottieni una licenza gratuita

Prova l’API senza limitazioni di valutazione richiedendo una licenza temporanea gratuita.

Conclusione

In questo articolo, abbiamo imparato come convertire documenti PDF in pagine Web HTML in C#. Abbiamo anche visto come convertire pagine specifiche di un PDF in HTML e aggiungere una filigrana al file convertito in modo programmatico. Inoltre, puoi saperne di più su GroupDocs.Conversion per .NET API usando la documentazione. In caso di ambiguità, non esitare a contattarci sul forum.

Guarda anche