Konwertuj plik PDF na HTML za pomocą języka C#

PDF to najpopularniejszy format udostępniania i drukowania dokumentów. W niektórych przypadkach może być konieczna konwersja dokumentów PDF na strony internetowe HTML. Taka konwersja pomaga w udostępnianiu zawartości dokumentów PDF, dzięki czemu odpowiednie zainteresowane strony będą mogły łatwo przeglądać je w dowolnej przeglądarce. W tym artykule dowiemy się, jak konwertować dokumenty PDF na strony internetowe HTML za pomocą języka C#.

W tym artykule zostaną omówione następujące tematy:

Interfejs API języka C# do konwersji plików PDF na HTML — bezpłatne pobieranie

Będziemy używać API GroupDocs.Conversion for .NET do konwersji plików PDF na HTML w języku C#. Zapewnia szybkie, wydajne i niezawodne rozwiązania do konwersji plików dla użytkowników końcowych. Proszę pobierz bibliotekę DLL interfejsu API lub zainstaluj ją przy użyciu NuGet.

Install-Package GroupDocs.Conversion

Konwersja plików PDF do HTML przy użyciu języka C#

Możemy łatwo konwertować dokumenty PDF na strony internetowe HTML programowo w języku C#, wykonując proste kroki podane poniżej:

  1. Najpierw załaduj dokument PDF, używając klasy Converter, podając jako argument ścieżkę pliku wejściowego. Jest to główna klasa kontrolująca proces konwersji dokumentu.
  2. Następnie utwórz instancję klasy MarkupConvertOptions. Zapewnia różne opcje konwersji do typów plików znaczników.
  3. Następnie opcjonalnie ustaw różne opcje konwersji, takie jak FixLayout, FixLayoutShowBorders itp.
  4. Na koniec wywołaj metodę Converter.Convert(), aby zapisać przekonwertowany plik HTML. Ta metoda przyjmuje ścieżkę pliku wyjściowego i konwertuje opcje jako argument.

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument PDF na stronę internetową HTML przy użyciu języka C#.

// Załaduj źródłowy plik PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Ustaw opcje konwersji dla formatu HTML
var options = new MarkupConvertOptions();
options.FixedLayout = true;
options.FixedLayoutShowBorders = false;

// Konwertuj do formatu HTML
converter.Convert(@"C:\Files\Conversion\converted.html", options);
Konwertuj plik PDF na HTML w języku C#.

Konwertuj plik PDF na HTML w języku C#.

Konwertuj zakres stron z formatu PDF na HTML w C#

Możemy programowo przekonwertować zakres stron dokumentu PDF na HTML, wykonując czynności podane poniżej:

  1. Najpierw załaduj dokument PDF, używając klasy Converter, podając jako argument ścieżkę pliku wejściowego.
  2. Następnie utwórz instancję klasy MarkupConvertOptions.
  3. Następnie ustaw numer strony, od której chcesz rozpocząć konwersję
  4. Następnie ustaw liczbę stron, aby przekonwertować całkowitą liczbę stron
  5. Na koniec wywołaj metodę Converter.Convert() ze ścieżką do pliku wyjściowego i opcjami konwersji, aby zapisać przekonwertowany plik HTML.

Poniższy przykładowy kod pokazuje, jak przekonwertować zakres stron z dokumentu PDF na plik HTML w języku C#.

// Załaduj źródłowy plik PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Ustaw opcje konwersji dla formatu HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.PageNumber = 2; // Start page number
options.PagesCount = 3; // Total pages to convert

// Konwertuj do formatu HTML
converter.Convert(@"C:\Files\Conversion\converted_pages_range.pdf", options);

Konwertuj określone strony pliku PDF na HTML w języku C#

Możemy przekonwertować określone strony dokumentu PDF na HTML, wykonując poniższe czynności:

  1. Najpierw załaduj dokument PDF, używając klasy Converter, podając jako argument ścieżkę pliku wejściowego.
  2. Następnie utwórz instancję klasy MarkupConvertOptions.
  3. Następnie podaj konkretne numery stron na liście oddzielonej przecinkami, które chcesz przekonwertować.
  4. Na koniec wywołaj metodę Converter.Convert() ze ścieżką do pliku wyjściowego i opcjami konwersji, aby zapisać przekonwertowany plik HTML.

Poniższy przykładowy kod pokazuje, jak przekonwertować określone strony dokumentu PDF na plik HTML w języku C#.

// Załaduj źródłowy plik PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Ustaw opcje konwersji dla formatu HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Pages = new List<int> { 1, 3 }; // List of page numbers to convert

// Konwertuj do formatu HTML
converter.Convert(@"C:\Files\Conversion\converted_specific_pages.pdf", options);

Konwersja plików PDF do HTML ze znakiem wodnym w C#

Możemy konwertować dokumenty PDF na strony internetowe HTML i programowo dodawać znaki wodne do przekonwertowanych plików HTML, wykonując czynności podane poniżej:

  1. Najpierw załaduj dokument PDF, używając klasy Converter, podając jako argument ścieżkę pliku wejściowego.
  2. Następnie utwórz instancję klasy WatermarkOptions.
  3. Następnie ustaw różne opcje, takie jak tekst, kolor, szerokość, wysokość, czcionka itp.
  4. Następnie utwórz instancję klasy MarkupConvertOptions.
  5. Następnie przypisz WatermarkOptions do MarkupConvertOptions.
  6. Na koniec wywołaj metodę Converter.Convert() ze ścieżką do pliku wyjściowego i opcjami konwersji, aby zapisać przekonwertowany plik HTML.

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument PDF na dokument HTML ze znakiem wodnym w języku C#.

// Załaduj źródłowy plik PDF
Converter converter = new Converter(@"C:\Files\Conversion\sample.pdf");

// Zdefiniuj tekstowy znak wodny
WatermarkOptions watermark = new WatermarkTextOptions("This is a sample watermark!")
{
    Color = Color.Red,
    Width = 500,
    Height = 100,
    Top = 0,
    Left = 300,
    Background = true
};

// Ustaw opcje konwersji dla formatu HTML
MarkupConvertOptions options = new MarkupConvertOptions();
options.Watermark = watermark;

// Konwertuj do formatu HTML
converter.Convert(@"C:\Files\Conversion\converted_with_watermark.html", options);
Konwersja plików PDF do HTML ze znakiem wodnym w języku C#.

Konwersja plików PDF do HTML ze znakiem wodnym w języku C#.

Zdobądź bezpłatną licencję

Wypróbuj interfejs API bez ograniczeń ewaluacyjnych, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule dowiedzieliśmy się, jak konwertować dokumenty PDF na strony internetowe HTML w języku C#. Widzieliśmy także, jak przekonwertować określone strony pliku PDF na HTML i programowo dodać znak wodny do przekonwertowanego pliku w języku C#. Poza tym możesz dowiedzieć się więcej o GroupDocs.Conversion dla .NET API, korzystając z dokumentacji. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też