Converteer HTML naar Word-document met C#

[HTML][2] (HyperText Markup Language) is een toonaangevende bestandsindeling voor webpagina’s die door alle browsers wordt ondersteund. In verschillende gevallen moeten we mogelijk HTML-bestanden of inhoud van live webpagina’s converteren naar Word-documenten ([DOC][3], [DOCX,][4] [DOT][5], [DOTM][6], [ DOCM[7]). Het helpt om de tekst van HTML-webpagina’s te bewerken of de tekstopmaak toe te passen. In dit artikel leren we hoe je HTML converteert naar een Word-document met C#. In dit artikel komen de volgende onderwerpen aan bod:

  • [C# API om HTML naar DOCX te converteren — Gratis download][8]
  • [HTML converteren naar Word in C#][9]
  • [Converteer een webpagina naar Word vanuit een URL in C#][10]
  • [HTML-tekenreeks naar woordconversie met C#][11]

C# API om HTML naar DOCX te converteren — Gratis download

Voor het converteren van HTML-bestanden of webpagina’s naar tekstverwerkingsbestandsindelingen gebruiken we [Aspose.Words for .NET][12] API. Het is een complete oplossing om Word-documenten programmatisch te maken, bewerken, converteren of analyseren. [Download][13] de DLL van de API of installeer deze met [NuGet][14].

Install-Package Aspose.Words

C# Converteer HTML naar Word - Korte zelfstudie

We kunnen eenvoudig HTML-bestanden programmatisch naar Word-documenten converteren door de onderstaande stappen te volgen:

  1. Laad een HTML-bestand met de klasse [Document][15].
  2. Roep de methode [Document.Save(string, SaveFormat)][16] aan om het HTML-bestand op te slaan als “output.docx”. De opsomming [SaveFormat][17] in de methode Document.Save() specificeert de indeling waarin u het HTML-bestand wilt converteren. Het volgende codevoorbeeld laat zien hoe u een HTML-bestand converteert naar DOCX met behulp van C#.

C# Converteer een webpagina naar Word vanuit een URL - Stapsgewijze zelfstudie

We kunnen ook een HTML-webpagina rechtstreeks van een live URL naar een Word-document converteren door de onderstaande stappen te volgen:

  1. Download eerst webpagina-inhoud als een System.Byte-array vanaf de opgegeven URL.
  2. Start vervolgens het MemoryStream-object met een array-object als argument.
  3. Maak vervolgens een instantie van de klasse [HtmlLoadOptions][19].
  4. Maak daarna een instantie van de klasse [Document][20] en initialiseer deze met de objecten MemoryStream en HtmlLoadOptions.
  5. Roep ten slotte de methode [Document.Save(string, SaveFormat)][16] aan om het HTML-bestand op te slaan als “output.docx”. Het volgende codevoorbeeld laat zien hoe u een HTML-webpagina converteert naar DOCX met behulp van C#.

C# Converteer een HTML-string naar Word - Korte handleiding

We kunnen dynamisch een Word-document genereren uit een HTML-string door de onderstaande stappen te volgen:

  1. Maak eerst een instantie van de klasse [Document][20].
  2. Maak vervolgens een instantie van de klasse [DocumentBuilder][21] met het object Document.
  3. Voeg vervolgens HTML in het document in met de methode [DocumentBuilder.InsertHtml(string)][22].
  4. Sla ten slotte het Word-document op met de methode [Document.Save(string, SaveFormat)][16]. Het volgende codevoorbeeld laat zien hoe u een HTML-tekenreeks converteert naar DOCX met behulp van C#.

Ontvang een gratis licentie

Probeer de API zonder evaluatiebeperkingen door [een gratis tijdelijke licentie][23] aan te vragen.

Conclusie

In deze korte zelfstudie hebben we geleerd hoe u HTML converteert naar een Word-document met C#. We hebben ook * gezien hoe live webpagina’s van een URL naar Word-bestanden * programmatisch kunnen worden geconverteerd. Bovendien kunt u meer leren over Aspose.Words voor .NET API met behulp van de [documentatie][24]. Neem bij onduidelijkheden gerust contact met ons op via het [forum][25].

Zie ook